1. Business
  2. Management
  3. Communication

Cómo limpiar datos en un archivo CSV

Scroll to top
This post is part of a series called Working With CSV Data Files.
How To Clean Up Keyword Research Data in a CSV File

Spanish (Español) translation by Charles (you can also view the original English article)

Independientemente del tamaño de su negocio, hay expectativas crecientes de que usted será competente en datos. Si bien el big data se promociona a nivel empresarial, la realidad para los freelancers y los propietarios de microempresas es que tendrá que ensuciarse las manos jugando con los datos en alguna etapa de su trabajo con el cliente.

Ya sea desde la transferencia de palabras clave a una hoja de cálculo, la programación de tweets, la sincronización de datos entre aplicaciones empresariales, la administración de listas de contactos o la importación de datos en una infografía, necesitará saber cómo limpiar los datos de una hoja de cálculo y organizarlos en un formato que cualquier aplicación o software en línea pueda leer.

La buena noticia es que ser capaz de gestionar datos y moverlos entre aplicaciones es una habilidad comercializable en sí misma y con algunos trucos bajo la manga, también puedes ahorrar mucho tiempo: tiempo que podrías estar gastando en un trabajo más rentable.

Activos del tutorial

Para completar este tutorial, necesitará:

  • una conexión a Internet
  • una cuenta de correo electrónico
  • una cuenta de Google (gratis)
  • Microsoft Excel (opcional)
  • Datos que desea limpiar (consulte a continuación para obtener más ejemplos)

¿Qué es un archivo CSV?

Un archivo CSV es un archivo de "Valores separados por comas". Este tipo de archivo toma todos los datos y coloca los encabezados de cada columna en la primera fila, luego enumera todos los datos en filas posteriores, con todos los datos no numéricos encerrados entre comillas ("como esto"), seguidos de una coma.

Un archivo CSV se puede leer en muchos tipos de aplicaciones y programas de software. En su forma más básica es un archivo de texto. Toma todos sus datos y los analiza (es decir, los divide en sus unidades de datos), para que pueda devolver los datos a otra aplicación.

Por ejemplo, estos son los datos de la herramienta de palabras clave de Google para la palabra clave "Archivo CSV":

Y aquí hay una muestra de cómo se ve en un formato CSV:

¿Por qué limpiar sus datos?

Cada vez más, los clientes esperan que usted sea capaz de administrar los datos cuando trabaja con ellos. Por ejemplo, se puede esperar que un freelancer que trabaja en la escritura de contenido SEO para un cliente muestre una lista de las palabras clave de cola larga que se están utilizando en cada artículo del blog programado para la producción, y que estas palabras clave se agreguen a una hoja de cálculo o calendario de contenido. Como productor de contenido independiente, se espera que produzca imágenes atractivas para ir con sus artículos. Puede agregar infografías simples a su contenido limpiando un archivo CSV de sus estadísticas de investigación y luego importarlo a un diagrama o herramienta de infografía.

A medida que big data y opendata continúan volviéndose más comunes, puede aumentar rápidamente el valor de sus ofertas de servicios empresariales y reducir su carga de trabajo al saber cómo mover datos.

Si dirige una microempresa que proporciona servicios de redes sociales, es posible que se espere que muestre a su cliente el valor de los tweets de una semana con anticipación y luego pueda programarlos para que se tuiteen a intervalos regulares durante toda la semana. O puede desarrollar un servicio empresarial en el que ayude a un cliente a mantener sus datos de contacto sincronizados entre su correo electrónico, campañas de marketing y software de gestión de relaciones con el cliente (CRM).

Tal vez su negocio ha crecido lo suficiente como para que desee comenzar a usar una aplicación de facturación y contabilidad en lugar de una hoja de cálculo. Puede limpiar un archivo CSV de todos sus datos financieros antiguos para que se importen fácilmente en su aplicación de facturación sin tener que hacer un montón de reingreso de datos.

A medida que big data y opendata continúan volviéndose más comunes, puede aumentar rápidamente el valor de sus ofertas de servicios empresariales y reducir su carga de trabajo al saber cómo mover datos. Ser competente en datos es una habilidad muy demandada y puede ayudarle a labrarse una propuesta de valor única. La limpieza de archivos CSV es fundamental para aprovechar al máximo todas estas oportunidades.

1. Creación de un archivo CSV a partir de una hoja de cálculo

Paso 1: Abra su archivo de hoja de cálculo

Un archivo CSV es simplemente un archivo de hoja de cálculo guardado en un formato de texto para que se pueda mover a otro programa de software o aplicación o herramienta basada en la nube. Así que primero, tendrá que abrirlo en su software de hoja de cálculo.

Si está utilizando Excel, abra el archivo de datos que desea moverse (Archivo > Abrir...). Si no tienes Excel, puedes registrarte en Google Drive con los detalles de tu cuenta de Google. Google Drive ofrece un conjunto de herramientas en línea basado en la nube que incluye una herramienta de hoja de cálculo. Después de registrarse, abra su hoja de cálculo en Google Drive.

La misma hoja de cálculo en Excel (izquierda) y Google Drive (derecha).

Paso 2: Compruebe los conceptos básicos de su archivo

En Excel, asegúrese de que solo tiene una hoja de cálculo en la hoja de cálculo. Las hojas de cálculo se muestran en la parte inferior de Excel. Normalmente se denominan Sheet1, Sheet2, etc. Asegúrese de que sólo hay una hoja. Si hay más de una hoja en el libro, haga clic en la pestaña de cada hoja adicional y asegúrese de que no hay datos en estas páginas. A continuación, haga clic con el botón derecho en las pestañas de la hoja 2 y así sucesivamente y elimine cada hoja adicional.

Paso 3: Guardar como un archivo CSV

En Excel, ahora seleccione Archivo > Guardar como.... Elija un nombre para el archivo y seleccione Valores separados por comas en el menú desplegable Formato.

En Google Drive, seleccione Archivo > Descargar como.... Seleccione Valores separados por comas en el segundo cuadro de menú y guárdelo en el disco duro.

2. Creación de un archivo CSV a partir de datos en una aplicación en línea o webtool

Cuando los datos se almacenan en una aplicación en línea (como FreshBooks, la aplicación de facturación y contabilidad para pequeñas empresas) o en una herramienta de sitio web (como la herramienta palabra clave de Google AdWords), es necesario utilizar las funciones de importación de la aplicación o herramienta para guardar los datos en un formato de archivo CSV.

Paso 1: En su aplicación en línea, busque una opción de exportación de datos

Si desea crear un archivo CSV con datos en una aplicación en línea, busque una opción de menú que le permita exportar los datos desde la aplicación.

En FreshBooks, por ejemplo, se encuentra en el menú Mi cuenta. Después de hacer clic en Mi cuenta aparece un menú de segundo nivel, donde puede seleccionar Importar y Exportar.

Ahora seleccione Archivo separado por comas (CSV) junto a Exportar clientes, facturas, personal y partes de horas.

Otras aplicaciones basadas en la nube pueden organizar sus opciones de manera diferente. Si no hay una opción en "Cuenta", busque un menú "Configuración" o una opción de menú "Datos". Usted debe ser capaz de localizar una opción de menú similar que le permite guardar los datos almacenados en línea en un archivo CSV.

Paso 2: En una herramienta basada en web, busque una opción de menú "Guardar como CSV"

Para una herramienta web, busque una opción de menú "guardar". Por ejemplo, en la herramienta Palabra clave de Google Adwords, hay un botón Guardar todo encima de la lista de ideas de palabras clave. Haga clic en Guardar todo para guardar una copia de todas las palabras clave de su búsqueda.

Ahora haga clic en el botón Descargar. Seleccione Todos los resultados de la búsqueda. Aparecerá un cuadro de diálogo que le ofrecerá la opción de guardar en formato CSV. Haga clic en Descargar para confirmar. Dependiendo del tamaño del archivo, puede tardar un poco de tiempo para que esto se prepare.

Finalmente, se le ofrecerá un cuadro de diálogo para indicar dónde desea guardar el archivo.

Otras herramientas en línea funcionan de manera similar.


3. Limpieza de un archivo CSV

Ahora que tiene un archivo CSV, deberá limpiarlo y asegurarse de que sea legible para donde quiera enviarlo. En algunos casos, es posible que solo desee usarlo en una hoja de cálculo.

En otros casos, es posible que deba limpiar el archivo CSV para poder importarlo a otra aplicación o herramienta en línea basada en la nube.

Paso 1. Excel: Importar el archivo CSV en una hoja de cálculo

En Excel, cree un nuevo libro. A continuación, seleccione la opción Importar en el menú Archivo.

Aparecerá un cuadro de diálogo. Asegúrese de que el archivo CSV esté seleccionado y haga clic en el botón Importar.

Ahora puede seleccionar su archivo CSV desde donde lo ha guardado.

Paso 2. Excel: Confirme que sus datos están 'Delimitados'

En Excel, ahora se le pedirá que confirme que los datos están delimitados. Es decir, el archivo CSV se rellena con datos separados solo por una coma. Excel debería ser capaz de decir automáticamente que esto es correcto. Ahora haga clic en el botón Siguiente.

Paso 3. Excel: Confirmar las columnas de datos

En Excel, ahora se le mostrará una vista previa de cómo se ordenarán los datos en columnas, en función del hecho de que los datos están separados por comas y los elementos de texto se pueden incluir entre "comas invertidas". Compruebe la vista previa de datos y seleccione o anule la selección de opciones de delimitador y opciones de calificador de texto hasta que la vista previa refleje el aspecto que espera que se vean los datos. En la mayoría de estos casos, esto se elegirá automáticamente. Por ejemplo, Excel sabrá que todos los datos de texto tienen un calificador de texto de comas invertidas, por lo que le permitirá saber que planea quitar las comas invertidas cuando importa los datos. Cuando esté satisfecho con la forma en que se importarán los datos, haga clic en el botón Siguiente.

Paso 4. Excel: Confirmar tipos de datos

En Excel, ahora se le pedirá que seleccione qué tipo de datos hay en cada fila. Seleccione General para todas las columnas ahora (personalizaremos cada columna de datos después de importarla). Vuelva a comprobar la configuración avanzada para asegurarse de que los datos reflejan las convenciones estándar para los números de miles y para las posiciones decimales.

Por ejemplo, si utiliza un origen de datos de EE. UU., generalmente se usa una coma para separar miles (por ejemplo, "1.000") y un punto y coma representa los separadores decimales. ¡Es al revés en Europa! Por lo tanto, dependiendo de su origen de datos original, es posible que deba cambiar esta configuración.

Ahora haga clic en el botón Finalizar para importar los datos CSV en su hoja de cálculo de Excel.

Paso 5. Excel: Elija dónde importar los datos

Finalmente, en Excel, se le preguntará dónde desea importar los datos. Si abrió un nuevo libro en el paso 1 anterior, seleccione la hoja Existente ya elegida para usted y, a continuación, haga clic en Aceptar.

Paso 6. Google Drive: Importa tu archivo CSV a una nueva hoja de cálculo

En Google Drive, puede hacer los pasos anteriores del 1 al 5 en el cuadro de diálogo. En primer lugar, cree una nueva hoja de cálculo en el menú Archivo. Ahora elija Importar en el menú Archivo.

Aparecerá un cuadro de diálogo. Seleccione su archivo CSV desde su disco duro.

Ahora seleccione Reemplazar hoja de cálculo, ya que ya hemos abierto una nueva hoja de cálculo.

Compruebe que la vista previa muestra cómo desea que los datos se distribuyan en columnas. En la mayoría de los casos, esto se configurará automáticamente correctamente. Si no es así, cambie el "carácter separador" a "tabulación" o "coma" para ver si los datos se muestran ahora correctamente en las columnas.

Haga clic en el botón Importar para continuar.

Paso 7. Ordenar columnas

Como limpiaremos sus hojas de cálculo de datos, será más fácil hacerlo si puede ver todos sus datos en columnas ordenadas. Ajuste el ancho de las columnas para mostrar mejor los datos. Mueva el cursor entre las letras de columna en la parte superior de Excel o Google Drive hasta que el cursor se convierta en un símbolo de movimiento de ancho y estire el ancho de columna para que sus datos sean más fáciles de leer.

Paso 8. Compruebe la fila de encabezado

Ahora compruebe que su primera fila tiene los encabezados de columna correctos. Al importar algunos datos de algunos orígenes, puede tener las fechas en la columna izquierda (el eje Y) y los valores a lo largo del resto de la fila, empezando por la segunda columna (el eje X). Por lo tanto, la primera columna en el eje X se dejará en blanco.

por ejemplo:

Si ese es el caso, ingrese una descripción (por ahora) para la primera columna, por ejemplo "Fecha" o "Mes".

Si usa los datos CSV en una hoja de cálculo, también puede establecer la primera fila como encabezados de columna. Esto es útil si está trabajando con grandes conjuntos de datos donde puede desplazarse hacia abajo y no poder ver la fila de encabezados.

En Excel, haga clic en Diseño de página en el menú Archivo. Elija Hoja en el menú del cuadro de diálogo emergente y haga clic en la fila de la hoja de cálculo para los encabezados de columna. Ahora debe indicarse en las filas de la caja para repetir en la parte superior por lo general como $1:$1.

En Google Drive, selecciona Congelar fila en el menú Ver y selecciona Congelar 1 fila para indicar la fila de encabezado.

Paso 9. Confirme qué datos necesita

Si está limpiando estos datos porque los va a mover a otra herramienta o aplicación en línea, compruebe los requisitos para importar datos en su aplicación de destino (consulte los ejemplos de casos de uso en la Sección 3. Mover datos, a continuación).

Si está limpiando su archivo CSV para compartirlo en una hoja de cálculo, confirme con su cliente qué datos quieren que pueda mostrar.

Paso 10. Eliminar datos innecesarios

Nota: Es posible que desee guardar una copia de su hoja de cálculo antes de comenzar a eliminar cualquier dato, en caso de que cambie de opinión o lo necesite más adelante.

Ahora elimine las columnas que no necesitará. Por ejemplo, si desea importar su investigación de palabras clave en un calendario de contenido, es posible que solo le interesen las columnas de palabra clave y volumen de búsqueda mensual local.

Puede eliminar las columnas que no necesita haciendo clic en la letra de encabezado de columna hasta que toda la columna esté sombreada. Ahora elige Eliminar en el menú Edición (en Excel) o eliminar columna en el menú Edición (en Google Drive).

Paso 11. Asegúrese de que las columnas de fecha están en el formato de fecha correcto

Una vez más, compruebe dónde va a importar los datos para cualquier requisito (consulte la sección 3 casos de usuario a continuación).

Si los datos del archivo CSV incluyen fechas, seleccione la columna con las fechas.

En Excel, seleccione Celdas... en el menú Formato. Ahora seleccione Número en el menú de la fila superior y Fecha en el menú del lado izquierdo. Elija el menú de fecha que se corresponde con los requisitos de importación, o seleccione la versión más legible para usted y su cliente, si solo está importando los datos en sus propias hojas de cálculo.

En Google Drive, selecciona la columna y haz clic en el botón que lee 123 en la barra de herramientas. Elija un formato de fecha de la lista o seleccione más formatos para ver un menú adicional de opciones de formato de fecha.

Si el archivo CSV requiere que las horas se incluyan con las fechas, asegúrese de que estén en el formato correcto (hh:mm o hh:mm:ss).

Si el archivo CSV requiere que las fechas y horas estén en columnas independientes, copie toda la columna y, a continuación, dé formato a la primera columna para que tenga solo formato de fecha y la segunda columna para que tenga solo formato de hora. El resto de los datos se eliminarán automáticamente.

Paso 12. Asegúrese de que todos los números son uniformes

Las columnas con datos numéricos se formatean mejor quitando los separadores de miles para que los números aparezcan como 23000, por ejemplo, y no como 23.000.

En Excel, seleccione la columna y elija de nuevo Celdas... en el menú Formato. Elija Número en el menú horizontal y Número en el menú de la izquierda. Asegúrese de que usar separador 1000 está desactivada.

Google Drive insiste en usar separadores de miles. Esto no afectará a sus importaciones de CSV, pero puede ser confuso si sus clientes son europeos. Haga clic en la columna para seleccionarla, seleccione la opción de menú Formato y haga clic en Número, luego seleccione Normal.

Paso 13. Agregar columnas que necesita

Compruebe la lista de datos que necesita que creó en el paso 9. Agregue columnas a la hoja de cálculo para cada uno de ellos. Algunas herramientas en línea también requieren que los datos se ordenen de una manera determinada (por ejemplo, la programación de tweets puede requerir un pedido específico para los datos del archivo CSV). Si ese es el caso, mueva las columnas ahora para que coincidan con el orden de importación preferido donde enviará los datos.

Ahora asegúrese de que los encabezados de columna coincidan exactamente con lo que espera su destino de importación. No utilice comas invertidas en esta fase para los encabezados o cualquier dato de texto en las columnas.

Paso 14. Incorpore datos limpiados en sus hojas de cálculo de trabajo

En algunos casos, como la limpieza de los datos de palabras clave, es posible que no desee agregarlos a ningún origen de destino, que no sea un calendario de contenido. Guarde una copia de la hoja de cálculo como archivo de copia de seguridad y, a continuación, seleccione las columnas que desea mover al calendario de contenido. Copie estas columnas ahora y péguelas en su hoja de cálculo de destino.

Paso 15. Guardar datos limpiados como un archivo CSV listo para importar a una herramienta en línea

Si el destino final de los datos limpiados es agregarlos a otro programa, ahora está listo para guardar esta hoja de cálculo como un archivo CSV para poder importarla a una aplicación en línea o una herramienta web.

Repita la Sección 1 Creación de un archivo CSV a partir de una hoja de cálculo de nuevo.


4. Mover datos de un archivo CSV a una aplicación en línea o una herramienta web

En muchos casos, tendrá que mover sus datos a otra aplicación en línea o herramienta web para completar su trabajo.

Para asegurarse de que la aplicación a la que los está agregando podrá leer sus datos, compruebe los requisitos para las columnas y los datos que deben incluirse.

Busque una opción de menú como "Cuenta", "Configuración" o "Datos" y revise la información de los datos de importación. Como alternativa, consulte la sección de ayuda de la aplicación/herramienta web. Busque qué encabezados de columna necesita usar y el formato necesario para cada columna de datos. Por ejemplo, si estás agregando datos a un Calendario de Google, necesitarías columnas para Fecha de inicio, Hora de inicio, Fecha de finalización, Hora de finalización, Asunto y (como opción) Lugar.

Por otro lado, si estaba importando datos sobre el trabajo del proyecto en una aplicación de seguimiento de tiempo como Toggl, quieren una columna para Hora de inicio, pero en lugar de Hora de finalización, debe tener una columna para Duración de la tarea, en la que indique cuánto tiempo se dedicó a la tarea en lugar de su hora de finalización.

Cada aplicación en línea y herramienta web puede ser ligeramente diferente, por lo que poder limpiar datos en archivos CSV significa familiarizarse con la documentación del usuario y las guías en línea para importar datos.

¿Cuáles son sus necesidades de datos?

¿Cuáles son sus necesidades actuales de datos? ¿Ha utilizado archivos con formato CSV para mover datos importantes para su negocio de una aplicación a otra? Háganos saber sobre sus proyectos de datos en los comentarios a continuación.