La inteligencia artificial o IA puede entenderse como una disciplina perteneciente a las ciencias de la computación, que plantea modelos computacionales de aprendizaje basado en redes neuronales biológicas humanas. En este sentido, se han planteado diversos modelos de IA, que gracias a los avances en la tecnología computacional ha permitido desarrollos de sistemas “inteligentes” que facilitan procesar mayor cantidad de datos en un tiempo menor, agilizando la toma de decisiones. La minería de datos (data mining – DM) se puede definir como el proceso de extracción de conocimiento a partir de cúmulos de datos. Se suele utilizar el término minería de datos como sinónimo de descubrimiento de conocimiento, pero realmente no son sinónimos, la minería de datos es solo un paso en el proceso de descubrimiento de conocimiento [35].
No obstante, la expectativa era que esa información fuera de una calidad lo suficientemente elevada de modo que permitiera obtener conclusiones que resultaran razonablemente válidas. Hoy en día, sin embargo, con la recopilación y almacenamiento de datos masivos de información, se está modificando la manera en que se aprehende la realidad. El valor de la información ya no reside en datos concretos, sino en la forma en que se correlacionan datos masivos para descubrir patrones que ni siquiera se habían imaginado. Así, cuando se analizan computacionalmente datos masivos, se puede proporcionar información más precisa sobre patrones, tendencias y asociaciones ocultas (Grable y Lyons 2018, 17).
Derecho PUCP
Previamente ha sido profesor o investigador en Manchester, Leeds, Duke, Purdue, Paris-Dauphine, Aalto, CNR-IMATI, IIASA, SAMSI y UPM. Ha escrito más de 130 artículos con revisión y 15 monografías sobre sus temas de interés que incluyen la inferencia bayesiana, la ciencia de datos, el análisis de decisiones y el análisis de riesgos, y sus aplicaciones, principalmente, a seguridad y ciberseguridad. ENT#091;LENT#093;as nuevas tecnologías de la información y la comunicación han creado condiciones para la aparición de sociedades del conocimiento. La sociedad mundial de la información en gestación solo cobrará su verdadero sentido si se convierte en un medio al servicio de un fin más elevado y deseable; la construcción a nivel mundial de sociedades del conocimiento que sean fuentes de desarrollo para todo, sobre todo para los países menos adelantados (Unesco, 2005, p. 29). Eso dificulta reconocer cuál es la línea que delimita lo privado de lo general en beneficio del bien común, como ocurre con el uso de cámaras de vigilancia, GPS, drones, identificación biométrica y de audio y artefactos inteligentes con la capacidad de recopilar y reconocer individualmente a los usuarios, porque su uso comúnmente es justificado bajo la premisa de brindar comodidad, control y seguridad. Por eso, la captura ininterrumpida de la información no solo permite abordar el fenómeno de la opinión pública de manera compleja y fluida, sino también sortear situaciones que son tradicionalmente adversas a las metodologías de encuestas que representan una “toma instantánea” altamente influenciada por la contingencia.
En primer término, es importante tener en cuenta que el registro médico surge de la práctica clínica, por tanto, el dato que se registra corresponde a un conjun to de acciones realizadas por profesionales de salud, en pos de atender o dar respuesta a una necesidad de salud de quien la requiera. En consecuencia, los datos que se generan no necesariamente son con fines de investi gación científica, por lo cual pueden contener errores, estar incompletos o pueden haberse registrado bajo di ferentes reglas de clasificación o unidades de medida, entre otros. Por lo cual, un desafío importante cuando se emprende el análisis de estos datos es la limpieza y validación de éstos20. Por otro lado, en el aprendizaje no supervisado, el Conviértete en un científico de datos exitoso con el bootcamp de ciencia de datos de TripleTen algoritmo del equipo no posee la respuesta correc ta, por lo que debe generar los perfiles o predicciones solo con la información histórica que se le entrega. Por ejemplo, se le podría solicitar identificar a grupos de pacientes con ciertas caracteristicas clínicas y luego, si esta clasificación tiene algún sentido clínico, se podría utilizar para tomar decisiones, por ejemplo, sobre el beneficio de algún determinado tratamiento que algún grupo podría tener22. El otro aspecto que define a los Big Data es la ve locidad, lo cual hace alusión al ritmo en que los datos se producen, pero también a la capacidad de respuesta en el análisis como para hacer de la información un producto que dé soluciones innovadoras y eficientes9.
«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»
Asimismo, se introducen algunas de las tendencias futuras para el desarrollo de Big Data por medio de la definición de aspectos básicos, alcance e importancia de cada una. La metodología empleada para la exploración incluye la aplicación de dos estrategias, una primera corresponde a un análisis cienciométrico; https://aquinoticias.mx/conviertete-en-un-cientifico-de-datos-exitoso-con-el-bootcamp-de-ciencia-de-datos-de-tripleten/ y la segunda, una categorización de documentos por medio de una herramienta web de apoyo a los procesos de revisión literaria. Como resultados se obtiene una síntesis y conclusiones en torno a la temática y se plantean posibles escenarios para trabajos investigativos en el campo de dominio.
La investigación logró evidenciar que el auge de la Datificación y el uso de herramientas tecnológicas de análisis de datos como Big Data, IA y ML, están transformando a las comunidades de los países de la región, lo que deriva en nuevas entidades digitales que tienden a mejorar su calidad de vida en los aspectos más notorios de la sociedad. Si bien es cierto que los procesos de Datificación y la utilización de técnicas de recolección y análisis de datos tienen enormes beneficios, para algunos resulta alarmante desconocer el destino y el uso de toda esa información recopilada. En el caso de Colombia, el documento CONPES 3920, sobre la Política Nacional de Explotación de Datos, establece la necesidad de anonimizar los datos recolectados por cualquier entidad e informar quién puede disponer totalmente de la información (CONPES 3920, 2018). En Chile existen varias leyes y normativas que regulan el uso de datos clínicos y se ha determinado que toda información de procedimientos y tratamientos médicos debe ser considerada como “dato sensible”, por lo cual solo pueden ser utilizados con el consentimiento de los pacientes (Zepeda, 2019). En cuanto a la protección de datos, es importante mencionar que hace falta promover una cultura de seguridad que incluya a grupos heterogéneos de la población, por ejemplo para el caso de Colombia se han observado antecedes interesantes sobre prácticas de seguridad informática a nivel universitario y policial (Estrada et al., 2019 y Estrada et al., 2021). En cuanto al transporte, la Ciudad de Rosario, en Argentina, estudió la movilidad de los ciclistas utilizando dispositivos de georreferenciación y análisis de datos, e identificó puntos de accidentes sin ciclovías, pero con alta presencia de ciclistas.