본문 바로가기

빅데이타

Big Data : 모두가 알았으면 하는 20가지 무료 Big Data 소스

Image


Big Data


나는 항상 모든 지점의 자료를 만든다. 회사는 큰 자료 분석을 시작하기 전에 자신의 거대한 데이터 저장소를 구축할 필요가 없다. 기업과 정부의 움직임은 공공 도메인으로 많은 양의 정보를 넣어 모든 사람에게 접근하여 많은 양의 자료를 만들었습니다.


큰 우량 기업이든 소규모 기업이든 지금 그 어느 때보다 더 많은 자료를 활용할 수 있다. 많은 나의 고객들이 상부 자료 소스에 대해 나에게 물었고 그들은 그들의 큰 자료결과를 사용할 수 있으며,


Data.gov http://data.gov


미국 정부는 자유롭게 온라인으로 모든 정부 데이터를 사용할 수 있도록하기 위해 작년에 약속했다. 이 사이트는 초기 단계이고, 기후에서 범죄에 이르기까지 모든 종류의 정보에 대한 포털 역할을 합니다.



US Census Bureau http://www.census.gov/data.html     미국 통계국


인구 자료, 지리 자료 및 교육을 다루는 미국 시민권의 삶에 대한 정보를 찾을 수 있습니다.


European Union Open Data Portal http://open-data.europa.eu/en/data/

유럽연합(EU) 개방형 데이터 포털


위와 같이, 유럽연합(EU) 기관의 자료에 기초를 둠.


Data.gov.uk http://data.gov.uk/


영국 국립 참고 문헌(1950년부터 영국의 모든 도서 및 간행물에 대한 메타자료)을 포함한 영국정부로부터의 자료


The CIA World Factbook https://www.cia.gov/library/publications/the-world-factbook/

미국 중앙정보국 월드 팩트북

세계 267개국 국가의 역사, 인구, 경제, 정부, 교통 및 군사 정보


Healthdata.gov https://www.healthdata.gov/

각 수준의 의료 데이터, 분석 및 인구 통계를 포함한 125년간의 미국의 의료 자료


NHS Health and Social Care Information Centre http://www.hscic.gov.uk/home

영국 국민 건강보험의 보건 사회 복지 정보 센터

영국 국민 건강보험의 건강 자료 세트


Amazon Web Services public datasets http://aws.amazon.com/datasets

아마존 웹 서비스 공공 자료

1000개의 게놈 프로젝트 즉  인간 유전 정보의 가장 포괄적인 데이터베이스와 지구의 NASA 위성 이미지의 데이터베이스를 구축하려는 시도를 포함한 공공 자료의 거대한 자산

Facebook Graph https://developers.facebook.com/docs/graph-api

페이스북 그래프

사용자의 페이스북 프로필에 대한 정보의 대부분은 개인이지만, 많지는 않습니다 - 페이스북은 정보의 엄청난 금액을 조회하는 방법으로 그래프 API를 제공하며 이것의 사용은 세계와 함께 공유하는 것에 대해 만족합니다.

Gapminder http://www.gapminder.org/data/

세계 각국의 경제, 의료 및 사회 통계를 덮고 있는 세계보건기구(WHO)와 세계은행 등의 소스에서 자료를 편집합니다.

Google Trends http://www.google.com/trends/explore

구글 트렌드

2004년 이후 특정 기간 동안의 검색량 통계

Google Finance https://www.google.com/finance

구글 금융 서비스.

실시간으로 업데이트된 40년 동안의 주식시장

Google Books Ngrams http://storage.googleapis.com/books/ngrams/books/datasetsv2.html

Google Books 프로젝트의 일부를 디지털화한 수백만권 책의 전체 텍스트를 찾고 분석합니다.

National Climatic Data Center http://www.ncdc.noaa.gov/data-access/quick-links#loc-clim

미국국립기상자료센터

미국 국립기상자료센터로부터 환경, 기상 및 기후 자료의 거대한 컬렉션이다. 세계에서 가장 큰 기상자료입니다.

DBPedia http://wiki.dbpedia.org

위키피디아 데이터베이스 검색 및 추출 커뮤니티

위키피디아는 전세계 모든 주제의 수백만개의 구조화 및 비구조화된 자료로 구성된 자료이다. 위키피디아 데이터베이스는 카탈로드 및 야심찬 계획을 가지고 있고, 자유롭게 사람들이 이러한 자료를 분석할 수 있도록 데이터베이스를 분배합니다.

Topsy http://topsy.com/

무료이고, 포괄적인 쇼셜 미디어의 데이타는 활용하기 어렵습니다. 그들의 모든 데이타는  Facebook이나 Twitter 등 큰 시스템을 위해서 무언가를 만들기 때문입니다. 그래서 그들은 그것을 그냥 주는 것을 원하지 않습니다. 그러나, Topsy는   잘2006년 부터 검색가능한 공개 트윗들의 데이타베이스를 제공합니다. 대화를 분석할 수 잇는 여러가지 툴들도 잘 구동 됩니다.


Likebutton http://likebutton.com/

Mines 페이스북의 공동 자료는 순간에 “좋아요” 라고 말한 사람의 개요를 제공하기 위한 전세계적인 자신만의 네트워크 입니다.

New York Times http://developer.nytimes.com/docs

뉴욕타임즈

1851년부터 뉴스 기사를 검색할 수 있습니다.

Freebase http://www.freebase.com/.

지역사회로 컴파일한 4500만 이상의 사람, 장소 및 물건에 대해 지역사회 구조화된 자료의 데이터베이스

Million Song Data Set http://aws.amazon.com/datasets/6468931156960467

100만개 노래 자료 세트


100만개 이상의 음악의 노래 및 종류의 메타 데이터. 아마존 웹 서비스의 일부

나는 이 목록이 유용하기를 희망합니다. 당신은 지금 어떤 큰 자료로 인해 데이터를 넣을 자리가 부족하지 않으십니까?  또한, 아래의 설명 필드를 사용하여 이 목록에 추가하기 위해 의견을 주시고 당신의 큰 자료 소스 중 한개를 추가하시기 바랍니다.

-----

언제나, 자는 당신이 이 게시판을 즐겼으면 좋겠습니다. 자세한 내용은 Big Data Guru column 에서 다른 게시판을 확인하시고 트위터, 링크드인, 페이스북, Slideshare 그리고 고급 성능 연구소를 통해 저와 연결해주시기 바랍니다.

Bernard Marr

Bernard Marr는 전세계적으로 BigData 및 분석 전문가입니다. 그는 비즈니스 저자, 전략의 기조 연설 및 컨설턴트,  성과 관리, 분석, 핵심성과지표 및 큰 자료의 베스트 셀러입니다. 그는 관리, 측정, 보고 및 성능의 분석이 나아질 수 있도록 기업들을 도와줍니다.

전체 프로필 보기

이글의 원문은 아래에서 확인하실 수 있습니다.

http://www.smartdatacollective.com/bernardmarr/235366/big-data-20-free-big-data-sources-everyone-should-know


(주)에스비아이에스 부설 솔루션 연구소