DataMédioAuto-Sync

Pandas Data Analyzer

porTHIAGONOMA·THIAGONOMA· v1.4.0 · atualizado em 2026-04-12T22:48:31.585Z

Score

Executa análise exploratória de dados (EDA) completa com pandas 3.x: profiling, correlações, detecção de outliers, missing values e feature engineering. Produz relatório HTML interativo e insights acionáveis.

pandasedadata-analysispythonstatisticsoutlier-detectionfeature-engineering

Linguagens

Python

1.6KStars

156Forks

19.8KUsos

Fork

Documento do Skill

SKILL.mdpandas-analyzer/workflow

Passo-a-passo detalhado do skill, referenciando as fases cognitivas:

SENSE — Carregar e inspecionar

```python

import pandas as pd

import warnings

warnings.filterwarnings('ignore')

# Detectar encoding automaticamente

import chardet

with open('data.csv', 'rb') as f:

encoding = chardet.detect(f.read())['encoding']

df = pd.read_csv('data.csv', encoding=encoding, sep=None, engine='python')

print(f"Shape: {df.shape}")

print(df.dtypes)

```

CONTEXTUALIZE — Análise descritiva

```python

# Resumo completo

print(df.describe(include='all').round(2))

# Missing values

missing = df.isnull().mean().mul(100).round(1).sort_values(ascending=False)

print(missing[missing > 0])

# Duplicatas

print(f"Duplicatas: {df.duplicated().sum()} ({df.duplicated().mean()*100:.1f}%)")

```

HYPOTHESIZE — Detectar outliers e padrões

```python

from scipy import stats

numeric_cols = df.select_dtypes('number').columns

# Z-score para outliers

z_scores = df[numeric_cols].apply(stats.zscore)

outliers = (z_scores.abs() > 3).sum()

print(f"Outliers por coluna (Z > 3):\n{outliers[outliers > 0]}")

# Correlações

corr = df[numeric_cols].corr()

high_corr = corr.unstack().sort_values(ascending=False)

high_corr = high_corr[(high_corr < 1) & (high_corr > 0.8)]

print(f"Correlações altas (> 0.8):\n{high_corr}")

```

RECOMMEND — Gerar relatório completo

```python

from ydata_profiling import ProfileReport

profile = ProfileReport(df, title="EDA Report", explorative=True)

profile.to_file("eda_report.html")

print("Relatório gerado: eda_report.html")

```

RECOMMEND — Pipeline de preprocessing

```python

from sklearn.pipeline import Pipeline

from sklearn.compose import ColumnTransformer

from sklearn.impute import SimpleImputer

from sklearn.preprocessing import StandardScaler, OneHotEncoder

numeric_transformer = Pipeline([

('imputer', SimpleImputer(strategy='median')),

('scaler', StandardScaler()),

])

categorical_transformer = Pipeline([

('imputer', SimpleImputer(strategy='most_frequent')),

('encoder', OneHotEncoder(handle_unknown='ignore', sparse_output=False)),

])

preprocessor = ColumnTransformer([

('num', numeric_transformer, numeric_cols.tolist()),

('cat', categorical_transformer, categorical_cols.tolist()),

])

```

REFLECT — Validar e documentar

Verificar ausência de NaN após preprocessing: `assert X_transformed.isna().sum().sum() == 0`

Salvar pipeline: `import joblib; joblib.dump(preprocessor, 'preprocessing.pkl')`

Reportar telemetria via mcp-skillschain

Telemetria de Agentes

Execuções

total

Taxa de Sucesso

últimos 30d

Latência Média

0.0s

p50

Alucinação

0.0%

detecção

Tokens Entrada

avg 0/exec

Tokens Saída

avg 0/exec

Uso por Plataforma

Skills Relacionados

Depende de ←ML Model Trainer

24%

Compõe comSQL Query Builder

21%

Compõe comData Visualization

21%

Similar aETL Pipeline Builder

15%

Similar a ←Jupyter Notebook Skill

60%

Co-executedSQL Query Builder

26%

Co-executedSentiment Analyzer

40%

Co-executed ←Jupyter Notebook Skill

50%

Co-executed ←Embedding Generator

40%

Co-executed ←Data Visualization

41%

Co-executed ←ML Model Trainer

40%

Co-executed ←ETL Pipeline Builder

40%

Árvore do Skill

Pandas Data Analyzer

pandas-analyzer

Fases Cognitivas6

1.SENSE: Percepção

2.CONTEXTUALIZE: Contextualização

3.HYPOTHESIZE: Hipótese

4.EVALUATE: Avaliação

5.RECOMMEND: Recomendação

6.REFLECT: Reflexão

Triggers15

analyze dataanalisar dadospandas analysisEDAexploratory data analysisdata profilinganálise exploratóriacorrelação entre variáveisdetecção de outliersmissing valuesfeature engineeringpandas DataFramedescribe datadata statisticsanálise pandas

Avaliar este Skill

Score Breakdown

⭐Avaliação Humana0%

🤖Sucesso de Agentes0%

🕐Atualidade100%

🔗Saúde de Dependências100%

🕸️Centralidade no Grafo0%

🛡️Segurança50%

CompositeScore = α·Humano + β·Agente + γ·Recência + δ·Deps + ε·Centralidade + ζ·Segurança

Instalação

$ synaptic mcp download pandas-analyzer

$ synaptic skills detail pandas-analyzer

$ synaptic skills live pandas-analyzer

Links

GitHub Repository