1  Buenas prácticas en bioinformática

1.1 ⭐ ¿Qué es un algoritmo?

Un algoritmo es un método para resolver un problema mediante una serie de pasos definidos, precisos y finitos.

  • Definido: si se sigue dos veces, se obtiene el mismo resultado (Es reproducible).
  • Preciso: implica el orden de realización de cada uno de los pasos.
  • Finito: Tiene un numero determinado de pasos, implica que tiene un fin.

Un algoritmo podemos definirlo como un programa o software.

1.2 🧩 ¿Qué necesitamos para escribir un buen software?

Crear software confiable implica aplicar principios de ingeniería:

  • Código mantenible (maintainable code)

  • Control de versiones (version control, ej. Git)

  • Rastreadores de problemas (issue trackers)

  • Revisiones de código (code reviews)

  • Pruebas unitarias (unit testing)

  • Automatización de tareas (task automation)

Basado en Wilson, et al. 2014. PLOS Biology

1.3 🤖 ¿Cómo te puede ayudar ChatGPT en tus buenas prácticas de bioinformática?

Aunque hoy en día existe cierto tabú alrededor del uso de la IA como ChatGPT, es una herramienta que realmente puede facilitarnos la vida. No reemplaza nuestro criterio, solo lo complementa. ¡Úsala sin miedo! Puede ayudarte muchísimo. ✨

ChatGPT puede ser una herramienta poderosa para mejorar tu flujo de trabajo:

  • Documentación automática: genera descripciones, títulos, secciones y ejemplos para tus scripts.

  • Explicación de código: te ayuda a entender funciones complejas o pipelines bioinformáticos.

  • Optimización responsable: sugiere mejoras sin comprometer la reproducibilidad.

  • Buenas prácticas: te recuerda estándares como estilo, modularidad, defensividad y testing.

  • Aprendizaje guiado: explica conceptos (FASTQ, SAM/BAM, ensambladores, alineadores, R, Python).

  • Depuración asistida: señala errores comunes y propone soluciones.

  • Reproducibilidad: ayuda a generar pipelines claros, estructurados y bien documentados.

  • Plantillas listas para usar: para README, .qmd, scripts, workflows o Snakemake.

ChatGPT no reemplaza tu criterio científico, pero sí amplifica tu precisión, claridad y reproducibilidad.

2 🦾 Buenas prácticas en R

Trabajar en R para bioinformática requiere código limpio, reproducible y fácil de compartir. Aquí tienes un conjunto de buenas prácticas recomendadas por expertos y comunidades como R for Data Science, The Tidyverse Style Guide, Bioconductor y The Carpentries.

2.1 📦 Carga solo los paquetes necesarios

  • Evita cargar 10 paquetes si solo usas 1 función.

  • Declara explícitamente tus dependencias.

  • Incluye siempre una sección “Paquetes” en tus scripts .R.

2.2 🧱 Modulariza tu código

  • Divide análisis largos en funciones y scripts separados.

  • Guarda funciones en /scripts/functions.R.

Esto evita repetir código y hace tus análisis más reproducibles.

🔄 Haz tu código pipeline-friendly

2.3 📚Documenta tus scripts

Al inicio de cada archivo .R incluye:

Note

r

# Title: Distribución de casas HP # Author: Mariana Devon # Date: 2025-11-25 # Description: Analiza la proporción de casas y genera un gráfico. # Inputs: hp_data.csv # Outputs: figure/house_pie.png # Packages: tidyverse

2.4 🤖 ¿Cómo ChatGPT te ayuda con buenas prácticas en R?

ChatGPT puede mejorar tus análisis en R de forma ética y eficiente:

  • Genera código limpio y estilizado siguiendo guías tidyverse.

  • Transforma scripts sucios en pipelines claros y reproducibles.

  • Explica errores en R con detalle (p. ej., object not found, NAs introduced).

  • Sugiere paletas, temas de ggplot y estilos visuales.

  • Documenta automáticamente tus funciones con formato roxygen2.

  • Optimiza la lógica sin sacrificar claridad.

  • Te genera plantillas listas para .qmd, pipelines o workflows.

  • Ayuda a detectar malas prácticas como copiar y pegar código o usar rutas absolutas.

En pocas palabras: ChatGPT actúa como asistente, auditor de estilo, tutor de R y copiloto de bioinformática, pero siempre con criterio científico tuyo 💛.

2.5 Referencias