Eng. de Dados | Tecnologia | Desenvolvimento

Categoria: Big Data

Instalando o CentOS no Virtualbox

Olá pequeno gafanhoto, seja bem-vindo ao meu blog de tecnologia! Hoje, vamos explorar a instalação do sistema operacional CentOS no Virtualbox, uma plataforma popular de virtualização. A instalação do CentOS no Virtualbox é uma tarefa fácil e rápida que permite aos usuários criar ambientes virtuais para fins de desenvolvimento, teste e treinamento. Além disso, a…

fevereiro 13, 2023
Comandos básicos do PySpark

Bem-vindo ao guia de comandos básicos do PySpark! PySpark é a interface de programação de aplicativos (API) em Python para o Apache Spark, uma plataforma distribuída de computação em cluster para processamento de big data. Neste guia, você aprenderá alguns dos comandos básicos do PySpark que são essenciais para manipular e analisar dados em grande…

janeiro 21, 2023
Criando dataframes no PySpark

Bem-vindo ao tutorial sobre a criação de dataframes com PySpark! PySpark é uma biblioteca de processamento distribuído para big data que permite trabalhar com grandes quantidades de dados usando o Apache Spark. Neste tutorial, aprenderemos como criar dataframes a partir de diferentes fontes de dados, como arquivos csv, parquet e bases de dados relacionais. Pronto…

janeiro 21, 2023
Configurando o PySpark no Google Colab

Nesta publicação irei demonstrar como configurar o PySpark no Google Colab de forma simples. Para os iniciantes na linguagem, é uma ótima forma de praticar e, para os mais avançados, uma boa opção para realizar testes de novas funcionalidades. Vamos praticar!

janeiro 13, 2023