Seja para aprofundar-se em pesquisas de mercado, construir um portfólio como analista ou buscar informações para expandir seu alcance no mercado, dados valiosos e confiáveis são cruciais para decisões bem fundamentadas.
No entanto, a busca por dados gratuitos, confiáveis e acessíveis na internet pode ser um desafio. Este artigo visa simplificar sua jornada, apresentando alguns dos principais portais para acesso a dados gratuitos.
Portais para Dados Gratuitos:
O Google Trends, uma ferramenta gratuita do Google, oferece amostras de dados não filtrados das pesquisas realizadas no Google. Apesar de exibir dados temporais desde 2004 em escala global e por cidade, ele não revela informações pessoais dos usuários.
O Google Trends permite refinar os dados por categorias, idiomas, entidades ou tendências de pesquisa. Por exemplo, as tendências de pesquisa diárias e tendências de pesquisa em tempo real mostram dados dos últimos sete dias.
FiveThirtyEight é um site de jornalismo de dados que disponibiliza dados sobre análises de pesquisa, esportes, cultura pop, política, ciência e economia.
O diferencial deste site é a possibilidade de baixar dados diretamente do portal ou do repositório oficial no GitHub, utilizando ferramentas de visualização para criar painéis visuais cativantes. Entre os dados disponíveis, destacam-se as previsões da copa do mundo e os dados de previsões da NHL para 2022-23.
O BuzzFeed News é uma plataforma de notícias americana que cobre uma variedade de temas, incluindo jornalismo, tecnologia, entretenimento, notícias de celebridades, cultura, DIY, saúde e política.
Através do GitHub, o BuzzFeed News oferece acesso aberto aos seus conjuntos de dados, ferramentas e análises. Um exemplo é o conjunto de dados de verificação de antecedentes de armas de fogo do FBI NICS.
Data.gov é o portal de dados abertos do governo dos EUA, que abriga mais de 250.000 conjuntos de dados bem documentados de agências governamentais federais e internacionais, promovendo um governo transparente e acessível.
Os dados podem ser acessados por tópico e agência. Alguns exemplos incluem o sistema nacional de dados de empréstimos estudantis e os dados populacionais de veículos elétricos.
Kaggle, uma plataforma de dados adquirida pelo Google, oferece uma vasta gama de conjuntos de dados sobre diversos tópicos. Esta comunidade permite compartilhar códigos, aprender, colaborar e aprimorar habilidades em ciência de dados, além de promover competições com premiações. Um exemplo é o conjunto de dados Estatísticas Globais do YouTube 2023.
EarthData, uma iniciativa da NASA, funciona como repositório de dados terrestres desde 1994, abrangendo informações de satélite, atmosfera, oceanos e hidrosfera. Dados como dados de calor extremo podem ser acessados, enquanto dados não terrestres podem ser encontrados no Sistema de Dados Planetários da NASA.
O IMDb oferece informações sobre filmes, séries de TV, podcasts, videogames, conteúdos de streaming e celebridades. Um exemplo são os Conjuntos de dados não comerciais do IMDb.
O AWS Public Dataset hospeda mais de 3.000 conjuntos de dados disponibilizados através dos serviços AWS. A maioria dos conjuntos de dados são baseados em projetos, incluindo o Atlas do Genoma do Câncer e os Conjuntos de dados COVID-19 Folding@home.
Inside Airbnb, um projeto de Murray Cox, coleta dados disponíveis publicamente do Airbnb para realizar análises de dados, como a análise de aluguel de Montreal.
O Google Dataset Search é um mecanismo de busca de conjuntos de dados que hospeda mais de 20 milhões de conjuntos de dados sobre diversos assuntos. Um exemplo é o Dados nacionais canadenses de monitoramento da qualidade da água a longo prazo.
O Repositório de Aprendizado de Máquina da UC Irvine oferece 624 conjuntos de dados para a comunidade de aprendizado de máquina, categorizados de acordo com as tarefas para as quais são adequados. Um exemplo é o Conjunto de dados Íris, popular em modelos de classificação e agrupamento.
O Datahub oferece uma variedade de conjuntos de dados sobre diversos tópicos, como os Rendimentos dos títulos do governo dos EUA a 10 anos, além de ferramentas e kits para profissionais de dados.
O Observatório Global de Saúde é um repositório de dados da OMS que apresenta estatísticas de saúde de mais de 1.000 indicadores dos 194 estados membros da OMS. Dados são registrados para acompanhar o progresso dos estados membros em direção aos Objetivos de Desenvolvimento Sustentável (ODS).
Esta plataforma é especializada em dados de pesquisa e inteligência de mercado, como os números de bilheteria do fim de semana da indústria cinematográfica do Reino Unido.
O GitHub também hospeda muitos repositórios que armazenam conjuntos de dados públicos, gratuitos e de código aberto, além de projetos colaborativos. O BuzzFeed News, por exemplo, tem um repositório no GitHub. Outros exemplos são o Repositório incrível de conjuntos de dados públicos e o conjunto de dados ‘Do You Even Lift’.
Data.world é uma plataforma colaborativa que hospeda projetos e conjuntos de dados. Uma grande parte dos dados são gratuitos, como Makeover Monday’s 2021/W16: passageiros aéreos mensais na América, que podem ser baixados ou acessados via API.
O Banco Mundial de Dados Abertos é um catálogo de dados econômicos e de desenvolvimento globais. Dados como as estatísticas globais sobre o custo e a acessibilidade de dietas saudáveis podem ser filtrados por indicador e país.
O Nasdaq Data Link oferece acesso a dados financeiros, econômicos e alternativos, como Divulgações de dados da Reserva Federal dos EUA, através de planilhas ou API.
A Plataforma de Dados da NYC Taxi and Limousine Commission registra informações de viagens de táxi em Nova York, incluindo detalhes como registros de viagens de táxi amarelo e verde na cidade de Nova York, locais de embarque/desembarque e tarifas.
O Academic Torrents é um catálogo com mais de 127,15 TB de dados de pesquisa, criado por e para pesquisadores.
Explorar e Aprender
Esperamos que esta lista facilite sua busca por dados que podem impulsionar seu negócio, enriquecer sua pesquisa de mercado, gerar vantagens competitivas e auxiliar na construção de um portfólio de dados excepcional. Aproveite as oportunidades, explore e simplifique sua jornada em busca de dados.