Como elaborar uma planilha cálculo de obra: Google Sheets ou Excel?
06/07/2023Como Construir Cronogramas de Obras Eficientes com Excel
01/08/2023Construindo análises de arquivos de engenharia, arquitetura e construção com ChatGPT, Python e Excel
Se você trabalha com engenharia, arquitetura ou construção, sabe como pode ser complexo lidar com grandes conjuntos de dados em planilhas Excel. Felizmente, temos uma solução inovadora para simplificar esse processo: o ChatGPT, uma inteligência artificial desenvolvida pela OpenAI. Neste artigo, vamos explorar como o ChatGPT pode ser usado para analisar arquivos Excel, criar gráficos e até mesmo auxiliar na conversão de código Python para macros Excel.
Neste artigo, utilizaremos a famosa Planilha para Gestão de Contratos e Obras e os dados inseridos em sua versão MODELO para a construção de análises no ChatGPT por meio da linguagem Python e a sua capacidade de se integrar ao Excel.
O que é ChatGPT e por que é relevante?
O ChatGPT é um modelo de linguagem AI treinado pela OpenAI que pode gerar texto coerente e relevante em resposta a uma entrada de texto. Isso o torna uma ferramenta poderosa para uma ampla gama de aplicações, incluindo análise de dados.
A capacidade do ChatGPT de entender e gerar texto significa que ele pode ser usado para converter código de uma linguagem de programação para outra. Isso é especialmente útil para pessoas que trabalham com Python e Excel, pois essas duas ferramentas são frequentemente usadas em conjunto na análise de dados. Por exemplo, os dados podem ser extraídos de uma planilha Excel usando Python, analisados usando bibliotecas Python como pandas e matplotlib, e os resultados podem então ser escritos de volta em uma planilha Excel.
O que são arquivos de engenharia, arquitetura e construção?
Os arquivos de engenharia, arquitetura e construção são geralmente planilhas Excel que contêm dados detalhados sobre vários aspectos de um projeto. Por exemplo, eles podem conter informações sobre os materiais usados, o custo dos materiais, o tempo necessário para concluir diferentes partes do projeto, e assim por diante. Esta planilha será o nosso exemplo:
Essas planilhas são ferramentas essenciais para engenheiros, arquitetos e gerentes de construção, pois ajudam a acompanhar o progresso do projeto, gerenciar custos e identificar áreas onde melhorias podem ser feitas. No entanto, devido à quantidade e complexidade dos dados que eles contêm, pode ser difícil extrair insights úteis dessas planilhas sem a ajuda de ferramentas de análise de dados.
Como o ChatGPT pode ajudar na análise desses arquivos?
O ChatGPT pode ser usado para simplificar e automatizar a análise desses arquivos Excel. Por exemplo, ele pode ser usado para extrair dados de uma planilha Excel, realizar análises nos dados e até mesmo criar visualizações gráficas dos resultados. Isso pode economizar muito tempo e esforço, pois você não precisa fazer todas essas tarefas manualmente.
Um aspecto especialmente útil do ChatGPT é a sua capacidade de converter código Python para macros Excel. Isso significa que você pode realizar análises complexas usando Python, e depois converter o código Python para uma macro Excel que pode ser executada diretamente na planilha Excel. Isso torna o processo de análise muito mais eficiente, pois você não precisa alternar entre Python e Excel.
Como posso usar o ChatGPT para analisar meus arquivos?
Vamos detalhar um exemplo de como você pode usar o ChatGPT para analisar seus arquivos de engenharia, arquitetura e construção. Para este exemplo, suponha que você tenha uma planilha Excel com duas abas, uma com dados de cadastro de obras e outra com dados de gestão de contratos.
Passo 1: Carregando os dados
O primeiro passo é carregar os dados da planilha Excel para o Python. Você pode fazer isso usando a biblioteca pandas, que é uma poderosa ferramenta para manipulação de dados em Python. Aqui está um exemplo de como você pode fazer isso:
import pandas as pd
# Carregar os dados da planilha Excel
df_obras = pd.read_csv("/mnt/data/OBRAS-GDO-PARA-CHATGPT.csv")
df_contratos = pd.read_csv("/mnt/data/OBRAS-E-CONTRATOS-GDO-PARA-CHATGPT.csv")
Essa etapa é importante porque permite que você acesse e manipule os dados em um formato que o Python possa entender.
Baixe os arquivos aqui:
https://1drv.ms/u/s!AtM6ZJqFHed4g4ZNeP6UfPpDmZmR0Q?e=couUnO
https://1drv.ms/u/s!AtM6ZJqFHed4g4ZMM1fUesIbDAGXTA?e=OX2SeM
Passo 2: Limpando e processando os dados
O próximo passo é limpar e processar os dados. Isso pode envolver a remoção de linhas ou colunas desnecessárias, a correção de erros de digitação ou formatação, a conversão de dados de um formato para outro, etc. A limpeza e o processamento dos dados são etapas cruciais na análise de dados, pois garantem que os dados estão em um formato adequado para análise.
Aqui está um exemplo de como você pode fazer isso usando Python:
# Remover espaços extras no início e no final dos nomes das colunas
df_obras.columns = df_obras.columns.str.strip()
df_contratos.columns = df_contratos.columns.str.strip()
# Converter as colunas de data para o formato de data do Python
df_contratos['Data Contrato'] = pd.to_datetime(df_contratos['Data Contrato'], format='%d/%m/%Y')
df_contratos['Data Início'] = pd.to_datetime(df_contratos['Data Início'], format='%d/%m/%Y')
df_contratos['Data Fim'] = pd.to_datetime(df_contratos['Data Fim'], format='%d/%m/%Y')
# Combinar os dois dataframes em um único dataframe
df_merged = pd.merge(df_contratos, df_obras, left_on='Nome da Obra', right_on='Nome da Obra', how='inner')
Passo 3: Realizando a análise
Agora que os dados foram carregados e limpos, você pode começar a análise. A análise exata que você realizará depende dos seus objetivos específicos e dos dados que você tem.
No nosso exemplo, vamos realizar algumas análises básicas nos dados, como calcular o total de dias para cada contrato, a duração média para cada obra e o total de dias de atraso no início e no fim da obra. Aqui está um exemplo de como você pode fazer isso:
# Calcular o total de dias para cada contrato
df_merged['Total de Dias em Obra'] = (df_merged['Data Fim'] - df_merged['Data Início']).dt.days
# Calcular a duração média para cada obra
average_duration = df_merged.groupby('Nome da Obra')['Total de Dias em Obra'].mean()
Passo 4: Criando gráficos
Finalmente, você pode querer visualizar os resultados da sua análise criando gráficos. Os gráficos podem ajudar a tornar os resultados da sua análise mais compreensíveis e podem destacar tendências ou padrões nos dados que podem não ser imediatamente aparentes a partir dos números brutos.
Aqui está um exemplo de como você pode criar gráficos usando a biblioteca matplotlib em Python:
import matplotlib.pyplot as plt
# Criar um gráfico de barras da duração média para cada obra
plt.bar(average_duration.index, average_duration.values)
plt.xlabel('Nome da Obra')
plt.ylabel('Duração Média (dias)')
plt.show()
Alguns gráficos que podem ser criados
Conclusão
A análise de arquivos de engenharia, arquitetura e construção pode ser uma tarefa complexa, mas o uso de ferramentas como o ChatGPT e o Python pode facilitar muito o processo. Este artigo mostrou como você pode usar o ChatGPT para analisar arquivos Excel, criar gráficos e até mesmo auxiliar na conversão de código Python para macros Excel.
Se você está interessado em aprender mais sobre como o ChatGPT pode ser usado para análise de dados, recomendo que você experimente você mesmo. Com a prática, você descobrirá que o ChatGPT é uma ferramenta poderosa que pode economizar muito tempo e esforço na análise de dados.
Perguntas Frequentes
1. O que é ChatGPT?
ChatGPT é um modelo de linguagem AI treinado pela OpenAI que pode gerar texto coerente e relevante em resposta a uma entrada de texto.
2. Como posso usar o ChatGPT para analisar arquivos Excel?
Você pode usar o ChatGPT para extrair dados de uma planilha Excel, realizar análises nos dados e até mesmo criar visualizações gráficas dos resultados.
3. O que são arquivos de engenharia, arquitetura e construção?
Os arquivos de engenharia, arquitetura e construção são geralmente planilhas Excel que contêm dados detalhados sobre vários aspectos de um projeto.
4. Como posso usar o ChatGPT para converter código Python para macros Excel?
O ChatGPT tem a capacidade de entender e gerar texto, o que significa que ele pode ser usado para converter código de uma linguagem de programação para outra.
5. Quais são os benefícios de usar o ChatGPT para análise de dados?
O uso do ChatGPT para análise de dados pode economizar muito tempo e esforço, pois você não precisa fazer todas as tarefas de análise manualmente. Além disso, o ChatGPT pode ajudar a simplificar a análise de dados, tornando-a mais acessível para pessoas sem um forte background em programação ou estatística.
Anexo: Análise Exploratória de Dados dos DataFrames: Obras e Contratos
Neste anexo, realizaremos uma Análise Exploratória de Dados (EDA) dos dataframes: df_obras
e df_contratos
. A EDA é um processo crítico onde realizamos uma investigação inicial sobre os dados para descobrir padrões, detectar anomalias, testar hipóteses e verificar suposições com a ajuda de estatísticas resumidas e representações gráficas.
Importação das Bibliotecas Necessárias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
Leitura dos Dados
df_obras = pd.read_csv("OBRAS-GDO-PARA-CHATGPT.csv")
df_contratos = pd.read_csv("OBRAS-E-CONTRATOS-GDO-PARA-CHATGPT.csv")
Análise Inicial dos Dados
Vamos começar examinando as primeiras linhas de nossos dataframes, verificando o número de linhas e colunas e os tipos de dados de cada coluna.
# Verificando as primeiras linhas dos dataframes
print(df_obras.head())
print(df_contratos.head())
# Verificando o número de linhas e colunas nos dataframes
print(df_obras.shape)
print(df_contratos.shape)
# Verificando os tipos de dados das colunas
print(df_obras.info())
print(df_contratos.info())
Análise Descritiva
Agora, vamos obter algumas estatísticas descritivas para cada coluna.
print(df_obras.describe())
print(df_contratos.describe())
Análise Gráfica
A visualização gráfica é uma parte importante da EDA. Ela nos permite entender a distribuição dos dados, identificar outliers e detectar relações entre diferentes variáveis.
Para variáveis categóricas, podemos usar gráficos de barras ou gráficos de torta para visualizar a distribuição das categorias. Para variáveis numéricas, podemos usar histogramas ou gráficos de densidade para visualizar a distribuição dos dados. Boxplots podem ser usados para visualizar a variação e detectar outliers.
Aqui estão alguns exemplos de como essas visualizações podem ser criadas usando matplotlib
e seaborn
:
# Histogramas para variáveis numéricas
df_obras.select_dtypes(include=[np.number]).hist(bins=30, figsize=(15, 10))
df_contratos.select_dtypes(include=[np.number]).hist(bins=30, figsize=(15, 10))
# Gráficos de barra para variáveis categóricas
df_obras['Tipo de Obra'].value_counts().plot(kind='bar')
df_contratos['Fase'].value_counts().plot(kind='bar')
# Boxplots para variáveis numéricas
for col in df_obras.select_dtypes(include=[np.number]).columns:
sns.boxplot(x=df_obras[col])
for col in df_contratos.select_dtypes(include=[np.number]).columns:
sns.boxplot(x=df_contratos[col])
Esperamos que esta análise exploratória de dados forneça insights valiosos sobre nossos dataframes e ajude na tomada de decisões informadas.
Claro, aqui estão algumas análises adicionais que você pode considerar:
- Análise de Outliers: Outliers são valores que são significativamente diferentes do resto dos dados. Eles podem ser causados por erros de digitação, erros de medição ou podem ser uma indicação de variação natural. Para identificar outliers, você pode usar gráficos de boxplot ou técnicas estatísticas como o escore Z ou o Método do Intervalo Interquartil.
- Análise de Tendência: Se seus dados tiverem um componente temporal, você pode analisar as tendências ao longo do tempo. Por exemplo, você pode querer ver como o preço global do contrato mudou ao longo do tempo. Para isso, você pode criar um gráfico de linha com o tempo no eixo x e o preço global do contrato no eixo y.
- Análise de Agrupamento: Se você tiver muitas categorias em suas colunas categóricas, pode querer agrupá-las em categorias menores. Por exemplo, se você tiver muitos tipos diferentes de obras, pode querer agrupá-las em categorias maiores, como “Residencial”, “Comercial”, etc.
- Análise de Correlação: Além de olhar para a correlação entre variáveis numéricas, você também pode olhar para a correlação entre variáveis categóricas. Para isso, você pode usar técnicas como o teste do qui-quadrado ou a correlação de Cramér.
- Análise de Impacto: Você pode querer analisar o impacto de uma variável sobre outra. Por exemplo, como o tipo de obra afeta o preço global do contrato? Você pode fazer isso usando técnicas estatísticas como a análise de variância (ANOVA) ou a regressão.