-
Comandos básicos do PySpark
Bem-vindo ao guia de comandos básicos do PySpark! PySpark é a interface de programação de aplicativos (API) em Python para o Apache Spark, uma plataforma distribuída de computação em cluster para processamento de big data. Neste guia, você aprenderá alguns dos comandos básicos do PySpark que são essenciais para manipular e analisar dados em grande […]
-
Criando dataframes no PySpark
Bem-vindo ao tutorial sobre a criação de dataframes com PySpark! PySpark é uma biblioteca de processamento distribuído para big data que permite trabalhar com grandes quantidades de dados usando o Apache Spark. Neste tutorial, aprenderemos como criar dataframes a partir de diferentes fontes de dados, como arquivos csv, parquet e bases de dados relacionais. Pronto […]
-
Configurando o PySpark no Google Colab
Nesta publicação irei demonstrar como configurar o PySpark no Google Colab de forma simples. Para os iniciantes na linguagem, é uma ótima forma de praticar e, para os mais avançados, uma boa opção para realizar testes de novas funcionalidades. Vamos praticar!