Inteligencia artificial y genealogía: Chat con documentos

ChatGPT es muy bueno explicándote de forma reducida y concisa mucho temas. 
Esta vez le pregunté a cerca de "Genealogía Genética"


La inteligencia artificial (IA) ha emergido como una tecnología revolucionaria en diversos campos, transformando la forma en que interactuamos con la información y abriendo nuevas posibilidades en áreas impensables hace unos años. Una de estas áreas es la genealogía, el estudio y seguimiento de la ascendencia y descendencia de las personas. A través de la aplicación de técnicas de inteligencia artificial, ahora será posible desentrañar y conectar hilos genealógicos de manera más rápida, precisa y profunda que nunca antes. La genealogía ha sido durante mucho tiempo una fascinante búsqueda de nuestras raíces, pero a menudo ha requerido largas investigaciones y búsquedas en archivos y registros históricos. Sin embargo, gracias a la inteligencia artificial, se ha abierto una ventana hacia el pasado, permitiéndonos en un futuro explorar y comprender nuestra historia familiar de una manera más eficiente. A través de algoritmos avanzados y análisis de datos masivos, la IA va a allanar el camino para descubrir conexiones familiares ocultas, revelando historias y vínculos que de otro modo habrían quedado enterrados en el tiempo.

La inteligencia artificial no solo acelerará el proceso de investigación genealógica, sino que también logrará superar algunas de las barreras tradicionales que dificultaban el rastreo de la ascendencia. Gracias a la IA, ahora es posible analizar grandes volúmenes de datos genealógicos dispersos, desentrañar patrones y encontrar relaciones incluso cuando los registros históricos son limitados o confusos. Una de estas herramientas ya fue aplicada por organizaciones como FamilySearch, que incluyó un sistema de transcripción (paleográfico), para la indexación automática de documentos digitalizados, muy interesante. Esto ha abierto nuevas posibilidades para aquellos que buscan reconstruir su árbol genealógico, y superará obstáculos que antes parecían imposibles en un corto y mediano plazo.


Próximamente, se crearán nuevas herramientas para ser aplicadas en la investigación

Aunque la aplicación de la Inteligencia Artificial haya iniciado hace un tiempo, muchas circunstancias de estados tecnológicos (como por ejemplo avances en el hardware y accesibilidad de tarjetas gráficas) además de los tiempos de entrenamiento (para entrenar modelos se necesita tiempo e información dirigida), permitieron que en el año 2022 se dieran saltos gigantes en el campo con la presentación de ChatGPT 3 (en términos de modelos de conversación) y de modelos como los de Stable Diffusion (en términos de modelos de generación de imagen). Es interesante también que estas tecnologías se estén construyendo con código abierto (en plataformas como GitHub) al compartir a la comunidad los archivos bases, por lo que se están desarrollando casi personalmente/privadamente avances agigantados que son construidos al mismo tiempo porque los adelantos también son publicados de forma colaborativa. Es como si estuviéramos armando una hamburguesa, donde cada componente de esta lo pone una persona distinta, para hacerla cada vez mejor y a la vez se puede cambiar cada parte de esta en cualquier instante.


Algunos modelos de inteligencia artificial que se han adecuado al entorno genealógico:

1. (Datos) Grupos genéticos de Myheritage: Construidos con documentación e investigación genética, combinando aprendizaje automático e inteligencia artificial. A mi parecer tienen resultados con muy buena precisión (en mi caso fue muy certero adivinando la región de mi bisabuela peruana, llamada "San Martín" y mi ancestro francés, proveniente de los Pirineos):

https://blog.myheritage.es/2020/12/myheritage-lanza-grupos-geneticos/?utm_source=organic_blog&utm_medium=blog&utm_campaign=web&tr_funnel=web&tr_country=ES&tr_creative=genetic_groups_feedback&utm_content=genetic_groups_feedback


2. (Imágenes) Reparación de fotos, colorización y corrección de imperfecciones: Son 3 herramientas distintas, centradas en la mejora de las fotos. Lo que hace la IA es leer los píxeles de las fotos y reconstruirlas con información nueva. No sé técnicamente Myheritage cuál modelo haya usado, pero es posible que sea un tipo GAN, que es uno de los sistemas más usados en la generación de imágenes, en contraste con los modelos de difusión (texto a imágen). En el 2020 publiqué un resultado de simulación de personajes históricos que no alcanzaron a ser fotografiados, y en los que se conserva pinturas de ellos, además adjunto la charla que dí en la UNAL, donde explicaba estos sistemas:

https://tebakegenea.blogspot.com/2020/10/re-creacion-grafica-de-personas-con.html


Estos modelos de generación de imagen lo que hacen es entrenar el computador, colocando a la vez imágenes de alta resolución, con otras iguales, pero de muy baja resolución, enseñándole a reconstruir la nueva foto, y como esta debería ser. A mi parecer después de comprobar muchos modelos, los mejores de mejoramiento de imagen son los de Topaz, aunque el de Myheritage es interesante (es un poco forzado, ya que se ve con claridad que está muy enfocado en arreglar solo caras, por lo que deja desenfocada las zonas a fuera de estas), lo que se podría hacer aquí es combinarlos. 


3. (Imágenes) Modelos de Difusión, StableDiffusion, Midjourney, Ai Time Machine y Dreambooth: Son herramientas nuevas, muy potentes de generación de imágenes basadas en modelos de difusión (se entrena la generación de texto en relación con la imagen). Utilizando StableDiffusion y ControlNet se pueden mejorar las fotos, colorearlas, e inclusive re-interpretarlas, es la herramienta más profesional en el entorno gráfico de inteligencia artificial. Myheritage implementó hace poco un sistema llamado "Ai Time Machine", basado en modelos de difusión y el sistema de entrenamiento Dreambooth, en el que puedes entrenar una cara y generar nuevas imágenes con ella. En un futuro con el sistema de entrenamiento de Lora se podrá entrenar caras de forma más eficiente.

Ai Time Machine:

https://blog.myheritage.com/2022/11/introducing-ai-time-machine-transform-yourself-into-a-historical-figure-using-everyday-photos/



Combinando modelos de Myheritage y Topaz, se empieza a generar muy buenos ejemplos
en la restauración de fotos. Este es un trabajo que hice utilizando otras herramientas como
Photoshop. Inés Palacio Moulédoux, fotografía de Ricardo Pardo Farelo a inicios del s.XX
Líbano-Tolima



4. (Videos, sonido y 3D) DeepStory, DeepNostalgia, Whisper, ControlNet y NERF: Son herramientas orientadas a contenidos tipo "media" y los entornos 3d basados en análisis de imagen, fotogramas, sonido y 2d. La imagen se lee, se crea un entorno 3d (aunque finalmente se plasma, dependiendo de la herramienta en un resultado 2d) y a la vez se generan nuevas composiciones basadas en la lectura de estas. DeepNostalgia de Myheritage anima fotos de personas. Ya se puede interpretar en tiempo real el audio de un video con herramientas como Whisper y generar traducciones orgánicas con herramientas como ChatGPT (y otros), además entrenar voces y usarlas para decir cosas que escribas. No se me haría extraño que Myheritage que ha explotado tanto estos recursos, saque una nueva herramienta donde puedas subir el audio de un ancestro ya muerto, entrenar la voz y generar nuevas composiciones con esta voz.

DeepStory y DeepNostalgia:

https://blog.myheritage.com/2021/03/deep-nostalgia-is-an-internet-sensation/


5. (Datos y letras) Transkribus, OCR, indexación y asistentes de escritura: Tengo un post aquí pendiente donde explico el uso de inteligencia artificial como Transkribus (lo tengo muy adelantado, pero no he tenido tiempo de terminarlo), una herramienta genial para transcribir textos como se haría normalmente en un proceso de paleografía (en donde técnicamente no se podría usar un modelo de decodificación tipo OCR, que lee y transcribe letras). Estos sistemas pueden ser usados en conjunto con otros que ayuden con la ortografía, redacción y gramática, para evaluar los documentos. Son muy buena opción al ser usados como add-ons y extensiones en aplicaciones como Chrome y otros, ya que ayudan de forma orgánica (más natural) a corregir con mayor precisión la escritura. ChatGpt 4, aunque es un software centrado en la conversación y asistencia textual, podría perfectamente reemplazar a varios sistemas de traducción y escritura actuales, pero faltaría especializarlo. Familysearch ya incluyó un sistema de indexación de documentos antiguos digitalizados muy bueno (habrán personas que no les gustará, como cualquier modelo actual imperfecto, pero en poco tiempo va a mejorar con certeza, ya que los modelos se pueden mejorar con mayor inversión de tiempo).

Transkribus:

https://app.transkribus.eu/es


6. (Datos y letras) ChatGPT, LLMs, Copilot, Bard, Bing y sistemas anti-plagio: Creo que en términos de investigación son las más importantes, ya que serán asistentes para el análisis de información, además de sistemas de búsqueda en bases de datos. Puedes usarlos como asistentes y son muy útiles para introducirte en temas complejos y labores de escritura, además que por intermedio del manejo de ciertos prompts (comandos de textos), puedes generar un entorno de entrenamiento básico, hacerlo que lo simule y genere resultados con base en este. Es decir, le puedes decir que se haga pasar por "Simón Bolivar" y hablar como si fuese él (aunque debido a que es muy censurado, estas simulaciones históricas no las realiza con una contextualización, sino con una especie de una supuesta moralidad actual, incompatible históricamente). Existen también programas muy interesantes que buscan si hay plagios en artículos, de estos podré hablar otro instante, aunque ChatGPT también tiene esta función, dependiendo del prompt.

Puedes usar gratis el modelo ChatGPT 3.5:

https://chat.openai.com/


De este último es que quisiera hablar, ya que con la inclusión de los sistemas de "plugins" de ChatGPT y la generación de modelos de código abierto tipo LLM (modelos de lenguaje), están empezando a aparecer apps y software muy interesantes para ser utilizados en la investigación genealógica. Pienso que todavía falta (pero poco), que sistemas como Bard de Google y Copilot de Microsoft se vayan integrando en el sistema y empiecen a ofrecer estas nuevas capacidades. También creo que hasta que se empiecen a generar herramientas de entrenamiento (datos e imágenes) dirigidos por el interesado o el usuario, potencializará mucho el uso de esta tecnología, y entre uno de estos primeros sistemas está por ejemplo Dreambooth (imágenes) o aplicaciones como "ChatPDF". Este último aunque como tal no es un entrenamiento con información o documentos, es una especie de "prompting" que fuerza ChatGPT 3.5 a analizar un documento con datos.


Lo que hace es tomar información de un archivo PDF o libro que se sube a su servidor y crea un entorno de Chat en el cual le podremos preguntar cualquier cosa respecto a la información que está contenida en el archivo, además que puedes compartir por intermedio de un enlace en chat a cualquier otra persona. En un futuro podremos con solo indicar una carpeta de archivos, documentos, libros y pdfs y entrenar a una AI conversacional (LLM), para que con solo preguntas nos pueda responder información a la cual fue entrenada (por ejemplo, de libros solo de genealogía), e indicarnos específicamente en qué páginas y archivos se encuentra la información en relación con la respuesta que nos da. Para los que han probado ChatGPT, no es muy preciso con datos genealógicos, ya que se basa en informaciones que están en línea (y no es toda, si no es limitada), y teniendo en cuenta que sistemas como Bard o Bing pueden acceder a la web al cotejar muchas fuentes sin un consenso como tal (o ausencia y huecos en la información), en instantes tiende a "inventar datos", por lo que hasta que no se entrenen con un fin específico e información confiable es difícil usarlos, generando buena calidad en la información.


Ejemplo de uso de ChatPDF





Proceso para usarlo:

1. Crear una cuenta (recomendado). Link:

https://www.chatpdf.com/


2. Subir el archivo en PDF. Que no contenga más de 120 páginas y 10 MB (versión gratis). Para esta prueba subí mi documento de investigación de la "Familia Satizábal", parte4:

https://tebakegenea.blogspot.com/2020/02/nueva-coleccion-de-familias-del-valle.html


3. Esperar a la lectura de la IA de la información del PDF.


4. Preguntarle lo que quieras. Aunque hay veces es preciso y da buenas respuestas, hay veces es muy flojo. Hay que entender también que está basado en ChatGPT 3.5, que no es tan bueno como ChatGPT4. Es posible que pronto haya herramientas mejores. En el caso de mi artículo le hice varias preguntas al respecto y tiene buena pinta. 


Logré compilar en un solo archivo una serie de documentos que escribí, llamados: "Los Santa del Líbano y San Vicente de Ferrer", donde se habla en gran parte de familias de Antioquia, y pueden probar el chat:

https://www.chatpdf.com/share/QeVp8UfwpdVjDQmkkJrhx



Alguna parte de la conversación con ChatPDF



Actualmente, hay unas herramientas interesantes que hacen cosas similares, pero su uso es complejo, como lo es Stable Diffusion. Para lenguajes de comunicación tipo ChatGPT (LLM), están UI (interfaces) como GPT4ALL, PrivateGPT para usar modelos de forma local como Vicuna o Llama, entre otros, mejorados por la comunidad y muy sorprendentes:




Por: Di. Mtr. Edgar Andrés Sarmiento García
Miembro Academia Colombiana de Genealogía
http://eddiemauro.design/



Comentarios

Entradas Populares

Echeverri o Echeverry?. Orígenes de la familia

Re-creación gráfica de personas por intermedio de inteligencia artificial

Embarcándote en tu árbol genealógico

Lanzamiento del libro: “Familias de El Líbano. Sus orígenes hasta inicios del siglo XX”

Ciertos núcleos familiares antioqueños descendientes de líneas sefardíes de 1er nivel

Gómez de Castro, gens sefardí toledana. ¿Antioqueños?. Genealogía genética.

Desiré Angée, francés en Colombia

Fundación del Líbano, Tolima

Familia Berrío y Jimenez de Quesada

Apellido Mauro - Mauri