PinnedRobert CarlosPySpark + Lei de Benford + Covid-19 BrasilAnalisando possíveis focos de fraude nas notificações de Covid-19 no BrasilDec 12, 2022Dec 12, 2022
PinnedRobert CarlosQuebrando a banca com Python, Probabilidade e EstatísticaAprenda a criar um script para determinar a frequência em que números ocorrem numa jogatinaAug 7, 20181Aug 7, 20181
PinnedRobert CarlosMineração de dados e Regras de Associação com R.Aprenda a descobrir padrões escondidos em seus dados comerciais usando a linguagem RMar 11, 2020Mar 11, 2020
PinnedRobert CarlosJoins em PySparkUnindo dados à esquerda e à direita com PySparkApr 30, 2021Apr 30, 2021
Robert CarlosApache NiFi — Inserindo novos campos em arquivos CSVsUse o processador UpdateRecord para transformar o conteúdo de um FlowFileAug 25, 2020Aug 25, 2020
Robert CarlosIngestão de dados no Apache Hive usando o Apache SparkUse PySpark para inserir dados de um arquivo de texto no Apache HiveMar 24, 20201Mar 24, 20201
Robert CarlosNormalizando dados com R e PythonTransformação de dados com Min-Max NormalizationFeb 27, 2020Feb 27, 2020
Robert CarlosUpgrading Cloudera Hadoop Oracle JDKCorrigindo horário no Cloudera Hadoop após fim do horário de verão 🌞Nov 17, 2019Nov 17, 2019
Robert CarlosHello World com Cloudera SearchIndexando dados de amostra no Apache SolrOct 20, 2019Oct 20, 2019
Robert CarlosFoliumUma simples biblioteca para criação de mapas para PythonMar 10, 20192Mar 10, 20192