Prácticas Educativas Digitales / Agentes TIC en acción
Formatos de archivos de datos: Estructura y transformación
Palabras clave: Formatos, Archivos de texto, IAG, Convertidores en línea, Dataset.
12 de noviembre de 2025
Objetivo
Analizar las estructuras y aplicaciones de los archivos de texto a través de la transformación de datos entre formatos con apoyo de herramientas digitales y de IAG.
Datos
Materia: Bases de Datos.
Plantel: Facultad de Telemática.
Programa Educativo: Licenciatura
Docente: Dr. José Román Herrera Morales.
Esta PED se implementó por primera vez durante el semestre agosto 2025 – enero 2026 en la Facultad de Telemática a través de la materia de bases de datos en la Ingeniería en Tecnologías de Internet con estudiantado de tercer semestre.
Esta práctica surge como una alternativa por la cual el docente proporciona contexto a sus estudiantes sobre el procesamiento de datos y sirve para la materia como un recurso de apoyo para que el estudiantado identifique cómo se puede transportar la información entre diferentes sistemas sin perder datos.
Otras razones por las que surge la práctica es para aprovechar la tecnología para invertir menos tiempo y aumentar el interés del estudiantado en este ejercicio -una tarea cotidiana de su profesión- y a su vez, representa un producto de la evolución de las técnicas de intercambio de información.
Cabe mencionar que, anteriormente el estudiantado debía realizar un programa con el cual el transformar los archivos de un formato a otro. Asimismo, los formatos que se detallan en la PED corresponden a formatos de texto que son legibles para el ser humano, algunos de ellos son: HTML, MarkDown (MD) y JSON. Con este planteamiento se resulta entonces que anteriormente, las y los estudiantes invertían más tiempo en elaborar productos (programas) que en aprender los contenidos y las competencias promovidas desde el curso que el profesor imparte.
A partir de estas necesidades se desarrolló la práctica que consiste en el uso de herramientas y repositorios digitales, con el objetivo de conocer la estructura y características de diferentes formatos de archivo de datos en texto para identificar, en cada tipo de formato, cuáles serían los mejores usos y aplicaciones en tareas de procesamiento, transporte e intercambio de datos. La práctica utiliza el dataset público de GoodReads disponible en GitHub, permitiendo al estudiantado trabajar con información bibliográfica real de más de 10,000 libros y experimentar con transformaciones de datos entre formatos ampliamente utilizados en la industria tecnológica.
Para la realización de la práctica se contextualiza al estudiantado sobre el dataset GoodRead y los formatos CSV, XML, JSON, HTML y Markdown (MD). Posterior a ello las y los estudiantes deberán seleccionar un libro de su interés del dataset con el que experimentaran en diferentes herramientas digitales para transformar los cinco formatos mencionados. Posterior a haber realizado esta transformación, validan la información obtenida y elaboran un reporte que incluya una tabla comparativa entre los cinco formatos y una descripción de los pasos que siguieron.
Como componente evaluativo, se revisan los archivos entregados en Classroom y se evalúan mediante una rúbrica de evaluación, adicionalmente se implementa un cuestionario mediante Google Forms que incluye diez preguntas de opción múltiple sobre conceptos fundamentales de formatos de datos, complementado con preguntas reflexivas sobre el uso de herramientas de inteligencia artificial generativa como facilitadoras del aprendizaje, permitiendo valorar tanto la comprensión conceptual como la reflexión crítica del estudiantado sobre el papel de la IA en su proceso formativo.
Gracias a la práctica y a través de la evaluación mediante la rúbrica y el formulario realizados se evidenció que el estudiantado logró obtener conocimiento conceptual y comprensión del uso de tecnología digital, diferencias estructurales entre formatos, identificación de casos de uso apropiados para cada formato, y documentación adecuada del proceso de transformación por lo que los resultados en el aprendizaje son favorables.
Esta práctica se sustenta en principios del construccionismo y el aprovechamiento de la tecnología digital en los procesos de enseñanza-aprendizaje, tomando en cuenta su uso reflexivo y ético. También, considera para su diseño al Aprendizaje Basado en Problemas, puesto que promueve el pensamiento crítico en la selección de formatos apropiados según contextos específicos, preparando al estudiantado para resolver problemas reales de interoperabilidad de datos en sistemas de información.
Además, fomenta el desarrollo de habilidades en documentación técnica mediante la elaboración de un reporte comparativo que sintetiza las características, estándares y aplicaciones de cada formato.
Finalmente, se debe tomar en cuenta que esta práctica es replicable a otros temas y áreas ya que el eje central es el transporte de datos volviéndola transversal a otros contextos. Asimismo, se comparten los recursos y materiales necesarios para comprender paso a paso cómo se llevó a cabo.
Preparación
Las actividades que realiza el docente son:
- Define objetivos de aprendizaje, recursos y materiales de apoyo, tareas a realizar, entregables y formas de evaluación de esta actividad.
NOTA: Para esta PED el docente selecciona GoodReads como plataforma principal debido a que contiene abundante información de carácter internacional y opera como red social para interactuar con las y los lectores.
- Prepara los recursos de apoyo que utilizará como el libro “The Hunger Games” obtenido del repositorio GitHub desde la plataforma GoodReads, y los enlaces a conversaciones compartidas de IAG (ChatGPT y Claude.ai) sobre formatos de datos.
- Elabora unas diapositivas en PowerPoint para contextualizar la PED en clase, incluyendo visualizaciones comparativas de los diferentes formatos con los que trabajarán sus estudiantes (CSV, XML, JSON, HTML y MarkDown).
- Elabora una guía detallada con los 5 pasos a seguir para el desarrollo de la práctica, especificando los entregables esperados: reporte en PDF y archivo ZIP con los 5 archivos de datos (CSV, XML, JSON, HTML y MD) la cual presenta como instrucciones en Google Classroom.
- Diseña una rúbrica de evaluación que valora: portada, cumplimiento de requerimientos, pasos realizados, referencias e inclusión de la DIA adaptada, comentarios y conclusiones, calidad del reporte, y entrega en tiempo y forma.
NOTA: Esta rúbrica se habilita directamente desde Google Classroom.
- Diseña un cuestionario de evaluación en Google Forms con 10 preguntas de opción múltiple sobre conceptos fundamentales y preguntas abiertas de reflexión sobre el uso de herramientas de IA generativa.
- Comparte los archivos de datos del ejemplo (HungerGames-1-2008.csv, .xml, .json, .html, .md) como referencias concretas para que el estudiantado se guíe en sus propias conversiones.
- Publica los requerimientos, recursos y rúbrica en Google Classroom con fecha de entrega definida.
Las actividades que realiza el estudiantado son:
NOTA: Con anterioridad al inicio de la práctica, investiga sobre los tipos de formatos y el transporte de datos con la intención de ampliar su contexto sobre el trabajo a realizar.
- Revisa el portal GoodReads y explora su estructura.
- Revisa los recursos compartidos en Classroom, incluyendo el dataset CSV y los archivos de ejemplo.
- Consulta los chats compartidos de IA generativa para comprender mejor los conceptos de formatos de datos.
- Se organiza de forma libre en equipos de hasta 3 personas.
- Descarga el dataset original “books.csv” desde el repositorio de GitHub.
Implementación
Las actividades que realiza el docente son:
- En la sesión con el estudiantado les contextualiza sobre formatos de archivo de datos en texto, su estructura, esquemas de codificación, características y enfoque para transporte o visualización.
- Presenta el portal GoodReads navegando al ejemplo del libro “The Hunger Games” de Suzanne Collins.
- Muestra ejemplos comparativos visuales de cómo se representa la misma información bibliográfica en los cinco formatos diferentes: CSV, XML, JSON, HTML y Markdown.
NOTA: Estos ejemplos se los muestra al estudiantado desarrollados con apoyo de Claude.ai y ChatGPT.
- Explica paso a paso el ejercicio completo utilizando “The Hunger Games” como caso de estudio, detallando: análisis del CSV original, extracción del registro específico, proceso de transformación a cada formato, y estructura de cada archivo resultante.
- Orienta sobre el uso de diferentes herramientas y técnicas disponibles: convertidores en línea, herramientas de IA generativa, desarrollo de programas o scripts personalizados o realización como edición manual.
- Resuelve dudas al estudiantado sobre la estructura y elaboración del reporte y la tabla comparativa, enfatizando aspectos como características generales, técnicas de marcado, usos principales, ventajas/desventajas, especificaciones estándar y fechas de publicación.
Las actividades que realiza el estudiantado son:
- Analiza la estructura y contenido del dataset (archivo books.csv) identificando los campos relevantes que contiene: book_id, goodreads_book_id, title, authors, original_publication_year, average_rating, ratings_count, image_url, etc.
- Selecciona un libro de su interés dentro del dataset de 10,000 registros.
- Extrae el registro del libro seleccionado generando un archivo CSV simplificado que contiene únicamente la cabecera y ese registro.
- Experimenta con diferentes herramientas digitales (convertidores online, ChatGPT, Claude.ai, scripts o editores de texto) para generar las transformaciones a los formatos XML, JSON, HTML y Markdown MD.
- Prueba y valida que cada archivo transformado mantenga la información sin pérdida de datos y con la estructura apropiada para cada formato.
- Elabora un reporte en PDF de mínimo 2 cuartillas que incluye:
- Introducción al tema.
- Tabla comparativa detallada de los cinco formatos.
- Descripción de los pasos realizados y herramientas utilizadas.
- Referencias bibliográficas en formato APA.
- DIA adaptada.
- Conclusiones reflexivas sobre aprendizajes y aplicaciones prácticas.
- Organiza los archivos generados en un paquete ZIP que contiene los 5 formatos del libro seleccionado.
- Sube en tiempo y forma los entregables en la plataforma Google Classroom.
Seguimiento
Las actividades que realiza el docente son:
- Revisa y evalúa los productos entregados utilizando la rúbrica diseñada, verificando que:
- Cada archivo de datos cumple con la sintaxis y estructura correcta del formato correspondiente, sin pérdida de información en las transformaciones.
- El reporte incluye la tabla comparativa con análisis de características, técnicas de codificación, usos, ventajas, desventajas, estándares y fechas de publicación de cada formato.
- En la sesión presencial posterior a las entregas, aplica el quiz evaluativo en Google Forms y analiza las respuestas, identificando fortalezas y áreas de oportunidad en la comprensión de conceptos.
- Recupera las respuestas reflexivas sobre el uso de IA generativa, documentando patrones de uso, percepciones del estudiantado y efectividad de estas herramientas como facilitadoras del aprendizaje.
- Proporciona retroalimentación mediante el classroom a cada equipo sobre los aspectos sobresalientes y mejorables de sus productos.
- Realiza un plenario con sus estudiantes enfatizando la importancia práctica de comprender formatos de intercambio de datos para la interoperabilidad en sistemas de información y comparte casos de uso profesionales.
Las actividades que realiza el estudiantado son:
- Entrega mediante Google Classroom el reporte en PDF y el paquete ZIP con los cinco archivos de datos (CSV, XML, JSON, HTML y MD) del libro seleccionado.
- En la sesión presencial posterior a la entrega, responde de forma individual el cuestionario “Quiz01 – Formatos de Archivos de Datos” en Google Forms.
NOTA: Este cuestionario incluye 10 preguntas de opción múltiple y preguntas reflexivas sobre su experiencia con IAG, indicando cuáles utilizaron con mayor frecuencia (ChatGPT, Claude.ai, Gemini, Perplexity u otras) y agregando comentarios sobre aprendizajes, recomendaciones y sugerencias.
- Participa en una sesión plenaria donde se debate sobre las ventajas y desventajas de cada formato según diferentes escenarios de uso, se comentan los resultados del quiz, se aclaran conceptos y se comparten experiencias sobre el uso de IA en el proceso de aprendizaje.
Esta PED se sustenta en los principios del construccionismo, donde el estudiantado aprende construyendo artefactos tangibles que representan su comprensión (Papert, 1980). Al trabajar con datos reales de GoodReads y transformarlos activamente entre diferentes formatos, las y los estudiantes experimentan directamente las diferencias estructurales y sintácticas de cada uno. Esta manipulación concreta de datos permite anclar conceptos abstractos en experiencias prácticas, facilitando la construcción de esquemas mentales robustos sobre interoperabilidad de datos aplicables en contextos profesionales.
La metodología de Aprendizaje Basado en Problemas fundamenta el diseño de esta práctica al utilizar un dataset real y plantear la necesidad de intercambiar información entre sistemas heterogéneos sin pérdida de datos (Barrows, 1996).
Por otra parte, se complementa con el aprendizaje basado en casos el cual permite la articulación de los conocimientos nuevos con los ya adquiridos, estimulando la autonomía, el desarrollo del pensamiento crítico y las competencias argumentativas en contextos reales (Jácome-Hortua, Muñoz-Robles y Gonzáles, 2022). El caso de estudio conecta con situaciones reales donde APIs utilizan JSON, configuraciones emplean XML, reportes requieren CSV y documentación necesita Markdown.
El enfoque incorpora también el uso reflexivo de tecnologías de inteligencia artificial generativa como herramientas de andamiaje cognitivo, donde las y los estudiantes utilizan ChatGPT o Claude.ai para realizar transformaciones que luego deben validar, comprender y documentar críticamente. Las preguntas reflexivas del cuestionario final permiten evaluar sobre el proceso de aprendizaje, identificando aportes y limitaciones de estas herramientas.
Desde la perspectiva técnica, esta práctica es relevante porque los formatos de intercambio de datos constituyen la base de la interoperabilidad en sistemas de información modernos. Comprender las características estructurales de cada formato permite tomar decisiones arquitectónicas informadas sobre persistencia, transporte y visualización de datos. El ejercicio evidencia problemáticas reales como pérdida de tipos de datos, sobrecarga sintáctica y limitaciones para representar relaciones complejas. Estos aprendizajes son cruciales donde microservicios, APIs RESTful y pipelines de datos requieren dominio práctico de múltiples formatos de serialización.
REFERENCIAS:
Barrows, H. S. (1996). Problem-based learning in medicine and beyond: A brief overview. New Directions for Teaching and Learning, 1996(68), 3-12. https://doi.org/10.1002/tl.37219966804
Jácome-Hortua, Muñoz-Robles y Gonzáles. (2022). Impacto de la implementación de la estrategia del Aprendizaje Basado en Casos (ABC) en estudiantes de prácticas clínicas en fisioterapia. IATREIA, 35(1), 48 – 56. http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-07932022000100048
Papert, S. (2020). Mindstorms: Children, computers, and powerful ideas. Edición revisada. Basic Books. ISBN 9781541675100. 288 págs.
- ChatGPT (OpenAI): Es una herramienta de inteligencia artificial que entiende y genera texto en lenguaje natural . Sirve para responder preguntas, redactar textos, explicar temas, crear ideas o ayudar en tareas académicas y profesionales, facilitando la comunicación y el aprendizaje al ofrecer información rápida y personalizada.
- Claude.ai (Anthropic): Asistente de inteligencia artificial que sirve para redactar textos, analizar documentos y apoyar en tareas académicas o laborales. Ayuda a comprender información y generar contenido de manera clara y segura.
- Copilot: Herramienta de inteligencia artificial que sirve para asistente en la escritura de texto, programación y tareas en otras aplicaciones, sugiriendo ideas y correcciones.
- DeepSeek: Herramienta de inteligencia artificial que sirve para la redacción y creación de contenido hasta la programación, educación y traducción.
- Gemini: Herramienta de inteligencia artificial entrenada para entender y operar con diferentes tipos de información como texto, imágenes, audio, video y código de programación.
- Perplexity: Es un motor de búsqueda conversacional impulsado por inteligencia artificial que ofrece respuestas rápidas y citando las fuentes para facilitar la verificación de la información.
- Portal GoodReads: Sitio web especializado en catalogación de libros que sirvió como referencia para explorar estructuras de datos bibliográficos reales. Se utilizó específicamente el libro “The Hunger Games” de Suzanne Collins como ejemplo demostrativo (https://www.goodreads.com/book/show/2767052).
- Repositorio GitHub goodbooks-10k: Repositorio público que contiene el dataset “books.csv” con información estructurada de 10,000 libros incluyendo campos como book_id, title, authors, publication_year, average_rating e image_url (https://github.com/zygmuntz/goodbooks-10k). Proporcionó datos reales de volumen significativo para la práctica.
- ConvertCSV.com: Herramienta práctica que sirve para transformar datos de un archivo de valores separados por comas y convertirlos en otros formatos, facilitando su uso en diferentes aplicaciones o para análisis de datos.
- Code Beautify: Herramienta en línea que sirve para mejorar la legibilidad del código, organizando la sangría y los espacios para qué sea más fácil de leer y entender.
- JSON Formatter: Herramienta que facilita la visualización y manipulación de datos JSON. Permite formatear, editar y validar documentos JSON de manera legible, generalmente con la ayuda de algoritmos avanzados.
- Visual Studio Code: Editor de código para programadores, gratuito y multiplataforma que permite editar el texto plano de los archivos de código para programación.
- Sublime Text: Es un editor de texto y código fuente multiplataforma, conocido por su velocidad, eficiencia y personalización. Es compatible con múltiples lenguajes de programación y ofrece potentes funciones como edición multilínea, selección múltiple y autocompletado inteligente.
- Notepad++: Editor gratuito y abierto que se utiliza para editar texto sin formato y código de programación gracias a su velocidad, tamaño ligero y funciones como el resultado de sintaxis y el autocompletado para múltiples lenguajes.
- CodePen: Es un entorno de desarrollo en línea que permite a las y los usuarios escribir, probar y mostrar código HTML, CSS, y JavaScript directamente en el navegador.
- Google Classroom: Plataforma principal para publicar instrucciones detalladas, rúbrica de evaluación, archivos de ejemplo en los cinco formatos, enlaces a recursos de apoyo (chats compartidos de IA generativa), gestión de entregas y comunicación asíncrona con el estudiantado.
- Google Drive: Sistema de almacenamiento en la nube para alojar y compartir recursos de la práctica: archivos de ejemplo (HungerGames en CSV, XML, JSON, HTML, MD), datasets, materiales de referencia y documentos entregables, facilitando acceso ubicuo y colaboración entre equipos.
- Google Forms: Utilizada para diseñar y aplicar el cuestionario evaluativo “Quiz01 – Formatos de Archivos de Datos” con 10 preguntas de opción múltiple sobre conceptos fundamentales y preguntas abiertas de reflexión sobre el uso de herramientas de IA generativa, permitiendo recopilación automática de respuestas y generación de estadísticas.
- Google Slides: Herramienta de Google desde la cual se pueden diseñar presentaciones en diapositivas. Dentro de la práctica se constituye como una opción por la cual el docente puede optar para elaborar la presentación con la que introducirá al estudiantado en las actividades de trabajo.
La implementación de esta práctica educativa digital en dos grupos de tercer semestre de Ingeniería de Software (40 estudiantes en total) mostró resultados favorables tanto en el desarrollo de competencias técnicas como en la integración reflexiva de herramientas de inteligencia artificial generativa.
El 100% de los equipos entregó completos los productos solicitados: reporte en PDF con tabla comparativa de formatos y archivo ZIP con los cinco archivos de datos (CSV, XML, JSON, HTML y MD) del libro seleccionado. La evaluación mediante la rúbrica de 7 criterios evidenció que el estudiantado logró comprender las diferencias estructurales entre formatos, identificar casos de uso apropiados para cada uno, y documentar adecuadamente el proceso de transformación incluyendo referencias en formato APA y la Declaración de uso de Inteligencia Artificial.
Los resultados del cuestionario aplicado en Google Forms revelaron aspectos significativos sobre la comprensión conceptual y el uso de tecnologías digitales. Las 10 preguntas de opción múltiple sobre características de formatos, ventajas/desventajas y casos prácticos mostraron un nivel satisfactorio de comprensión de los conceptos fundamentales, con mayor dominio en identificación de características de CSV y JSON, y algunas áreas de oportunidad en la comprensión profunda de XML y sus mecanismos de validación.
Respecto al uso de herramientas de IA generativa, el 85% del estudiantado consideró que estas tecnologías facilitaron significativamente su conocimiento y aprendizaje del tema. ChatGPT fue la herramienta más utilizada (reportada por el 48% de estudiantes), seguida por Claude.ai (16%) y Gemini (8%), mientras que un 7% indicó no haber utilizado ninguna herramienta de IA.
Los comentarios cualitativos del estudiantado en las preguntas abiertas del quiz destacaron que las herramientas de IA generativa les ayudaron a “entender las diferencias de una forma más rápida”, “comprender los casos de uso de manera práctica”, “validar que los formatos estuvieran bien estructurados” y “generar la información de forma sintética para el reporte”. Sin embargo, también expresaron reflexiones críticas importantes como “es un tema fácil de comprender cuando se utilizan herramientas para comparar, pero también aprendí que debo validar lo que me dicen estas herramientas” y “me ayudó a entender los distintos formatos de datos y cómo se usan, pero creo que es necesario aprender a hacerlo manualmente primero para luego usar IA”.
Estos hallazgos evidencian que la práctica logró no solo el desarrollo de competencias técnicas sobre formatos de datos, sino también una apropiación crítica y reflexiva sobre el rol de la inteligencia artificial como herramienta de apoyo al aprendizaje, promoviendo un uso ético y consciente de estas tecnologías emergentes en contextos educativos y profesionales.
En el siguiente enlace se encuentran los archivos de trabajo que el docente muestra a sus estudiantes para introducirles a la práctica: https://drive.google.com/drive/folders/1H47f3vs1QBlNPJfauqTz-wO9nLHMCLu4
- Portal web GoodBooks con el libro de ejemplo “The Hunger Games (2008)”: https://www.goodreads.com/book/show/2767052
- Dataset CSV – top1000 books: raw.githubusercontent.com/zygmuntz/goodbooks-10k/refs/heads/master/books.csv
- Conversación con ChatGPT sobre las características de los formatos XML y JSON: https://chatgpt.com/share/3becd94b-e6dc-4bb4-a7ba-1483c98152dd
- Conversación con Claude sobre la tabla comparativa de Formatos de Datos: https://claude.ai/public/artifacts/8146dc3e-bace-41aa-88e1-8e3fc31ec820
A continuación, se comparten los enlaces a las herramientas y las plataformas utilizadas para el trabajo de la práctica:
- ChatGPT: https://chatgpt.com/
- Claude IA: https://claude.ai/
- ConvertCSV: https://www.convertcsv.com/
- Code Beautify: https://codebeautify.org/
- CodePen: https://codepen.io/
- Copilot: https://copilot.microsoft.com/
- DeepSeek: https://deepseek.ai/
- GoodReads: https://www.google.com/url?q=http://goodreads.com&sa=D&source=docs&ust=1761600913009180&usg=AOvVaw1d4kNdI10u7qNd4nkezmKD
- Google Classroom: https://support.google.com/edu/classroom/answer/6072460?hl=es&co=GENIE.Platform%3DDesktop
- Google Drive: https://drive.google.com/drive/my-drive?hl=es-419
- Google Forms: https://docs.google.com/forms/
- PowerPoint: https://powerpoint.cloud.microsoft/es-mx/
- JSON Formatter: https://jsonformatter.org/
- Notepad++: https://notepad-plus-plus.org/downloads/
- Perplexity: https://www.perplexity.ai/
- Sublime Text: https://www.sublimetext.com/
Visual Studio Code: https://code.visualstudio.com/
