Eng. de Dados | Tecnologia | Desenvolvimento

Categorias de Declarações SQL

Nesta jornada, vamos explorar as diferentes categorias de declarações SQL: DML (Data Manipulation Language), TCL (Transaction Control Language), DDL (Data Definition Language) e DCL (Data Control Language). As declarações DML são o coração da linguagem SQL, permitindo que você recupere, insira, atualize e delete dados em suas tabelas. Através de exemplos práticos, mostraremos como utilizar […]

julho 19, 2023
Banco de Dados Relacional – SQL (Structured Query Language)

Neste tipo de banco de dados os dados são organizados em forma de tabela, com colunas e linhas. Nas colunas são inseridas as informações necessárias e, nas linhas, são colocados os dados propriamente ditos. No modelo relacional, toda a estrutura do banco de dados deve ser planejada antes. Caso contrário, não será possível inserir as […]

julho 19, 2023
Instalando o CentOS no Virtualbox

Olá pequeno gafanhoto, seja bem-vindo ao meu blog de tecnologia! Hoje, vamos explorar a instalação do sistema operacional CentOS no Virtualbox, uma plataforma popular de virtualização. A instalação do CentOS no Virtualbox é uma tarefa fácil e rápida que permite aos usuários criar ambientes virtuais para fins de desenvolvimento, teste e treinamento. Além disso, a […]

fevereiro 13, 2023
Comandos básicos do PySpark

Bem-vindo ao guia de comandos básicos do PySpark! PySpark é a interface de programação de aplicativos (API) em Python para o Apache Spark, uma plataforma distribuída de computação em cluster para processamento de big data. Neste guia, você aprenderá alguns dos comandos básicos do PySpark que são essenciais para manipular e analisar dados em grande […]

janeiro 21, 2023
Criando dataframes no PySpark

Bem-vindo ao tutorial sobre a criação de dataframes com PySpark! PySpark é uma biblioteca de processamento distribuído para big data que permite trabalhar com grandes quantidades de dados usando o Apache Spark. Neste tutorial, aprenderemos como criar dataframes a partir de diferentes fontes de dados, como arquivos csv, parquet e bases de dados relacionais. Pronto […]

janeiro 21, 2023
Configurando o PySpark no Google Colab

Nesta publicação irei demonstrar como configurar o PySpark no Google Colab de forma simples. Para os iniciantes na linguagem, é uma ótima forma de praticar e, para os mais avançados, uma boa opção para realizar testes de novas funcionalidades. Vamos praticar!

janeiro 13, 2023
Voltamos logo…

janeiro 8, 2023