Nuestro asistente no nace sabiendo; necesita aprender de muchos ejemplos. Es como enseñarle a un niño a leer, mostrándole miles de libros.

33.jpg

  1. Carga de datos: Recopilamos miles de artículos, cada uno con su título, resumen y las categorías correctas ya asignadas por expertos.
  2. Uniendo las piezas: Juntamos el título y el resumen de cada artículo en un solo "texto grande".
  3. Traducir a su idioma: Las categorías que están en palabras (como "Cardiovascular") las convertimos a números (0 o 1). ¿Por qué? Porque a veces un artículo puede ser sobre el corazón Y el cerebro, y nuestro asistente necesita entender que puede tener varias etiquetas.
  4. La Prueba de Fuego: Dividimos todos estos artículos en dos grupos: uno para que nuestro asistente "estudie" (entrenamiento) y otro para hacerle un "examen sorpresa" (prueba). Nos aseguramos de que ambos grupos tengan una mezcla similar de categorías, para que el examen sea justo.