DATA ANALYSIS WITH PANDAS

¿Por qué elegir el curso de Data Analysis with Pandas

Acerca del curso

Python es uno de los lenguajes más utilizados para el análisis de datos y la ciencia de datos. Es fácil de aprender a comparación de otros lenguajes de programación y tiene algunas librerías centradas en el análisis de datos muy poderosas como es el caso de Pandas que nos permite analizar millones de datos. Este curso tendrá un nivel de principiante ya que tendremos un breve Crash Course de Python y a partir de ahí nos adentraremos a Pandas.

El curso está dividido en 7 módulos, de los cuales 2 son introductorios y los 5 restantes se enfocarán en alguna característica especifica de Pandas, y están diseñados para que el alumno pueda replicar las herramientas adquiridas en distintos proyectos. Así mismo el curso contara con datasets para poder trabajar todos a unisón sobre ellos.

Prerrequisitos:

• Requerido
- Conocimientos básicos de algún software de procesamiento de hojas de cálculo como Excel
- Entendimiento básico de tipos de datos (strings, integers, floats, booleans)

• Recomendado
- Comprensión básica usando Python (variables, functions, lists)

Temario (14 horas)

• Introducción
➢ Introducción al Curso
➢ Instalación y Setup
➢ Introducción a Jupyter Notebook

• Python Crash Course
➢ Variables y Data Types
➢ Lists
➢ Dictionaries
➢ Operators
➢ Functions

• Series
➢ Create A Series Object from a Python List
➢ Create A Series Object from a Dictionary
➢ Introducción de Attributes
➢ Introducción de Methods
➢ Parameters y Arguments
➢ Import Series with the .read_csv() Method
➢ The .head() and .tail() Methods
➢ Python Built-In Functions
➢ More Series Attributes
➢ The .sort_values() Method
➢ The inplace Parameter
➢ The .sort_index() Method
➢ Python's in Keyword
➢ Extract Series Values by Index Position
➢ Extract Series Values by Index Label
➢ The .get() Method on a Series
➢ Math Methods on Series Objects
➢ The .idxmax() and .idxmin() Methods
➢ The .value_counts() Method
➢ The .apply() Method
➢ The .map() Method

• DataFrames I
➢ Intro to DataFrames I Module
➢ Shared Methods and Attributes between Series and DataFrames
➢ Differences between Shared Methods
➢ Select One Column from a DataFrame0
➢ Select Two or More Columns from a DataFrame
➢ Add New Column to DataFrame
➢ Broadcasting Operations
➢ A Review of the .value_counts() Method

• Introducción

➢ Introducción al Curso
➢ Instalación y Setup
➢ Introducción a Jupyter Notebook

• Python Crash Course
➢ Variables y Data Types
➢ Lists
➢ Dictionaries
➢ Operators
➢ Functions

• Series
➢ Create A Series Object from a Python List
➢ Create A Series Object from a Dictionary
➢ Introducción de Attributes
➢ Introducción de Methods
➢ Parameters y Arguments
➢ Import Series with the .read_csv() Method
➢ The .head() and .tail() Methods
➢ Python Built-In Functions
➢ More Series Attributes
➢ The .sort_values() Method
➢ The inplace Parameter
➢ The .sort_index() Method
➢ Python's in Keyword
➢ Extract Series Values by Index Position
➢ Extract Series Values by Index Label
➢ The .get() Method on a Series
➢ Math Methods on Series Objects
➢ The .idxmax() and .idxmin() Methods
➢ The .value_counts() Method
➢ The .apply() Method
➢ The .map() Method

• DataFrames I
➢ Intro to DataFrames I Module
➢ Shared Methods and Attributes between Series and DataFrames
➢ Differences between Shared Methods
➢ Select One Column from a DataFrame0
➢ Select Two or More Columns from a DataFrame
➢ Add New Column to DataFrame
➢ Broadcasting Operations
➢ A Review of the .value_counts() Method
➢ Drop Rows with Null Values
➢ Fill in Null Values with the .fillna() Method
➢ The .astype() Method
➢ Sort a DataFrame with the .sort_values() Method
➢ Sort DataFrame with the .sort_index() Method
➢ Rank Values with the .rank() Method

• DataFrames II
➢ This Module's Dataset + Memory Optimization
➢ Filter a DataFrame Based on A Condition
➢ Filter with More than One Condition (AND - &)
➢ Filter with More than One Condition (OR - )
➢ The .isin() Method
➢ The .isnull() and .notnull() Methods
➢ The .between() Method
➢ The .duplicated() Method
➢ The .drop_duplicates() Method
➢ The .unique() and .nunique() Methods

• DataFrames III
➢ Intro to the DataFrames III Module + Import Dataset
➢ The .set_index() and .reset_index() Methods
➢ Retrieve Rows by Index Label with .loc[]
➢ Retrieve Rows by Index Position with .iloc[]
➢ Second Arguments to .loc[], .iloc[]
➢ Set New Values for a Specific Cell or Row
➢ Set Multiple Values in DataFrame
➢ Rename Index Labels or Columns in a DataFrame
➢ Delete Rows or Columns from a DataFrame
➢ Create Random Sample with the .sample() Method
➢ The .nsmallest() and .nlargest() Methods
➢ Filtering with the .where() Method
➢ The .query() Method
➢ A Review of the .apply() Method on Single Columns ]
➢ The .apply() Method with Row Values
➢ The .copy() Method

• Trabajando con datos en formato de texto
➢ Common String Methods - lower, upper, title, and len
➢ The .str.replace() Method
➢ Filtering with String Methods
➢ More String Methods - strip, lstrip, and rstrip
➢ String Methods on Index and Columns
➢ Split Strings by Characters with .str.split() Method
➢ More Practice with Splits
➢ The expand and n Parameters of the .str.split() Method