tacosdedatos

Isaac Arroyo
Isaac Arroyo

Posted on

Google Colab 101: Crear y usar Jupyter Notebooks

Instalar cosas en la computadora tiene ventajas y desventajas:

  • Ventajas:
    • Te sientes genial cuando instalas algo y te sale bien (no importa si solo era darle aceptar a todo hasta que acabe el proceso) 💻
  • Desventajas:
    • Te puedes sentir como el mundo y la vida no están de tu lado, si hiciste algo mal y crees que no estas hecho para ello y te bajoneas bieeeen gacho 🥺

Para el caso específico de Python en ciencia/análisis de datos, hay opciones que son bastante amables que nos ahorran el proceso de instalar Python y qué librerías instalar.

Una de mis favoritas es ✨Google Colab

¿Qué es Google Colab?

En cortar y rápidas palabras podemos definir a Google Colab como una computadora en la nube que ya tiene todo lo necesario para hacer código en Jupyter Notebooks para Ciencia/Análisis de Datos y Machine Learning.

Lo único que necesitas es una cuenta de Google, ya que como es en la nube, no tienes que instalar algo en tu computadora.

Aquí un video oficial de Google, presentando esta herramienta:

Crear tu propia Jupyter Notebook

Opción 1: Directamente desde Drive

En una carpeta, la que gustes, pero de preferencia que sea donde estés trabajando tus proyectos de relacionados a datos y vas a ir a pestaña de "+ Nuevo" y después de las opciones de crear algún documento de Google, le sigues a "Más" y te aparecerán más opciones. Asumiendo que jamás has usado Google Colab, puede que no te aparezca en las opciones, así que le das click a la parte de "Conectar más aplicaciones"

Menu de opciones para agregar un nuevo documento o archivo en Google Drive

Aparecerá un buscador y tendrás que escribir "colaboratory" y te aparecerá la opción para que instales.

Menu de búsqueda de más aplicaciones para Drive

Google Colaboratory como resultado de búsqueda

Pagina para instalar Google Colaboratory

Los pasos subsecuentes son aceptar los términos, confirmar que lo quieres instalar al volver iniciar sesión de Google y listo 🙌, ya te aparecerá la opción de crear una Jupyter Notebook con Google Colab

Crear archivo en Google Colaboratory en menú de opciones

Notebook nueva creada

Opción 2: Desde la página de Google Colab

También cuentas con la opción de entrar a la página de Google Colab y desde ahí crear una nueva Jupyter Notebook, lo que tienes que hacer es ingresar a https://colab.research.google.com/ y tu pantalla te mostrará el siguiente recuadro:

Pantalla de inicio en Google Colaboratory

Al tener esta pantalla, tienes dos opciones...

  1. Abrir el documento de "bienvenida": Este documento te muestra el funcionamiento de las Jupyter Notebooks en Colab así como celdas de código para que ejecutes y veas el resultado, así como también editar el código. Los cambios que hagas no se guardarán a menos de que guardes una copia en tu Drive.

Boton para guardar copia en nuestro Drive

  1. Crear una nuevo Jupyter Notebook: Cuando crear un nuevo archivo, tal como se mostró en la Opción "Directamente desde Drive", empiezan con un nombre por defecto (Untitled0, Untitled1, y así sucesivamente), que recomiendo siempre, no guardarlo de con ese nombre

notebook creada desde pagina de Google Colab

Activar Python 3

Te darás cuenta de la imagen anterior, del lado derecho se puede leer Connect, esto significa que no esta activado Python para trabajar (por así decirlo, no quiero entrar en detalles y vocabulario técnico), por lo que hay que darle clicl y activarlo.

Boton de Connect

La pestañita junto al botón de Connect la ignoraremos por el momento, ya que son más opciones de conexión que no usaremos en esta ocasión.

Conexión y activación de Python 3, listaaa

La imagen de arriba muestra cuando se confirma la activación de Python 3 en nuestro ambiente de trabajo

Y de esta manera ya podemos empezar a usar Python en la Jupyter Notebook con Google Colab.

Nota: Carpeta Colab Notebooks

Cuando creamos un archivo desde la página de Google Colab, se crea automáticamente una carpeta llamada Colab Notebooks en nuestro Drive.

Es importante tomar en cuenta que cualquier archivo creado desde la página de Google Colab o que sea copiado a nuestro Drive, se guardará en esa carpeta.

carpeta Colab Notebooks en Drive

Abrir una Jupyter Notebook de un repositorio de GitHub

Una opción que yo considero bonita, es que Google Colab nos permite compartir la Jupyter Notebook con otras personas como cualquier otro archivo de Google (Docs, Sheets y Slides).

Además, una opción que considero bonita, es que puedes jugar con las notebooks que comparten las personas en GitHub.

Paso 1. Seleccionar un repositorio de GitHub

Como ejemplo usaremos la notebook de las gráficas que hice con Python para mi servicio social.

El repositorio es el siguiente:

GitHub logo isaacarroyov / ss_plots

Repositorio de gráficas realizadas en Python para mis boletines de servicio social (Ecuaciones Diferenciales y Análisis Vectorial) || Repository of the plots made in Python for my social service bulletins (Differential Equations and Vector Calculus)

Gráficas de los Boletines de Ecuaciones Diferenciales y Análisis Vectorial

Proyecto de Servicio Social (en resumen):

Durante el primer semestre del 2020, estuve realizando mi Servicio Social en la Facultad de Ingeniería de la UADY (FIUADY) en el proyecto "Programa de Ayudantías en Ciencias Básicas para el Reforzamiento del Desarrollo Académico" (PACB), sin embargo, para la comunidad estudiantil de la FIUADY es mayormente conocido como "Ayudantías".

Este proyecto tiene como objetivo (y como su nombre lo dice) ayudar a los estudiantes de la FIUADY con las asignaturas del bloque de Ciencias Básicas, tales como: Álgebra I, Álgebra II, Cálculo Diferencial e Integral I (Cálculo Univariable), Cálculo Diferencial e Integral II (Cálculo Multivariable), Análisis Vectorial (tambien conocido como Cálculo Vectorial) y Ecuaciones Diferenciales. El equipo de alumnos involucrados en este proyecto de Servicio Social se encargaba de dos asignautas cada quien, en mi caso, estuve a cargo de Ecuaciones Diferenciales y…

Pero la Jupyter Notebook que usaremos se llama "Newsletters_DifferentialEquations_plots.ipynb" y se encuentra en el siguiente link ➡️ https://github.com/isaacarroyov/ss_plots/blob/master/DifferentialEquations_plots/Newsletters_DifferentialEquations_plots.ipynb

El link que lleva directo a la Jupyter Notebook nos facilitará el siguiente paso.

Paso 2. Abrir el archivo deseado con Google Colab

Este paso, tiene dos opciones...

Paso 2.1: Abrir Jupyter Notebook desde la página principal de Google Colab

En la página principal de Google Colab, vamos a ir a la pestaña de GitHub y debe aparecer lo siguiente en la pantalla

Pagina al seleccionar GitHub en la pagina de Google Colab

Y en el espacio que se tiene para escribir podemos poner el link del repositorio o mejor... el link de la Jupyter Notebook que nos interesa ver.

Dar el link del repositorio no es mala idea, el detalle es que si el repositorio tiene muchos archivos, en lo personal me llego a revolver y hasta cierto punto, desesperar 😅. Y si no te sabes el nombre específico de la notebook, te puedes equivocar de archivo.

resultado de link del repo de github

Ahora, si doy el link directo de la Notebook de interés, me va a mostrar/resaltar directamente ese archivo.

archivo de GitHub resaltado

Ahora, si no se resalta, no te preocupessss 🤓, con solo dar click a la lupa 🔍 (una o dos veces, la verdad creo que depende del humor de Google Colab) te va a abrir la Jupyter Notebook.

Paso 2.1: Abrir Jupyter Notebook desde la página principal de Google Colab

Esta opción es bastante similar a la opción anterior. Solamente se tiene que crear un archivo de Google Colaboratory nuevo y en la pestaña de Archivo/File seleccionar Abrir Notebook/Open notebook.

opcion de abrir notebook

Esta opción aparecerá un menú idéntico a la opción anterior y los siguientes pasos, son idénticos.

menu similar a la option 2

Pase 3. Jugar con la Notebook

Al correr una celda de una Notebook de un repositorio de GitHub, se dará una advertencia sobre la procedencia de la Notebook (ya que no es de Google, es de GitHub), si la Notebook no usa datos o archivos que no se tienen acceso, entonces no debe haber problema para jugar con el archivo.

Advertencia de Google Colab

Nota: Para jugar con esta Notebook de ejemplo, comentar (#) las líneas de código que sean:
plt.rc('text', usetex=True)
plt.grid( b = True, alpha = 0.5, linestyle = 'dashed' )

Hacer esto antes de ejecutar el código, de no hacerlo, surgirán errores. La solución es reiniciar el runtime en la pestaña Runtime > Restart Runtime

notebook de GitHub

Recuerda, si quieres guardar los cambios que hagas, tienes que copiar la Notebook en tu Drive.


Eso es todo por el momento ✨, en los siguientes días escribiré de otras temas relacionados a Google Colab (instalar librerías que no tiene, cargar conjuntos de datos, conectar tus cambios a tu repositorio de GitHub, entre otros temas que piense o se sugieran 👀)


Mis redes sociales:
Twitter/X | Instagram | Behance

Discussion (1)