一. Kaggle datasets

每個資料集都是一個小型社群,大家可以在其中討論資料、查詢一些公共程式碼或在其中建立自己的專案。裡面有大量的實際資料集,這些資料集具有各種形式、大小和不同的格式。您還可以看到與每個資料集關聯的“核心”,其中許多不同的資料科學家提供了筆記來分析資料集。有時候你可以在筆記本上找到一些演算法來解決這個特定資料集中的預測問題。

二. Amazon Datasets

該資料來源包含各種不同領域的許多資料集,如公共交通、生態資源、衛星影象等。你可以透過搜尋框快速尋找所需要的資料集,它也有資料集描述和使用的資料集的例子,這是非常有幫助的。

這些資料集儲存在Amazon Web Services (AWS)資源中。如果您正在使用AWS進行機器學習實驗和開發,這將非常方便,因為這些資料集就儲存在AWS網路本地。

三. UCI機器學習庫

用於機器學習和資料分析的資料集(有福了)

加州大學資訊與計算機科學學院擁有一個包含了100多個數據集的資料庫。它根據機器學習問題的型別對資料集進行分類。您很多型別的系統找到訓練的資料集。

四. 谷歌的資料集搜尋引擎

用於機器學習和資料分析的資料集(有福了)

在2018年穀歌推出一個工具箱服務,可以按名稱搜尋資料集。他們的目標是統一成千上萬個不同的資料集儲存庫,幫助大家很容易的找到資料集。

五. 微軟資料集

2018年7月,微軟宣佈啟動“微軟研究院開放資料”計劃。

它提供在已發表的研究中使用的資料集,用於促進全球研究社群之間的協作。

六. 公共資料集

它按主題組織的各種資料集,如生物學、經濟學、教育學等。這裡列出的大多數資料集都是免費的。

七. 政府資料集

為了提高透明度,許多國家向公眾共享了各種資料集。下面是部分列表:

· EU Open Data Portal:。 歐洲政府資料集

· New Zealand’s Government Dataset。

· Indian Government Dataset。

·

https://www。

opendatani。gov。uk/

北愛爾蘭公共資料集

八. 計算機視覺資料集

如果您正在從事影象處理、計算機視覺或深度學習,那麼這應該是您需要的實驗資料來源。

視覺資料包含少量的大型資料集,可用於構建計算機視覺(CV)模型。您可以透過特定的CV主題來查詢特定的資料集,如語義分割、影象標題、影象生成,甚至可以透過解決方案(自動駕駛汽車資料集)來查詢資料集。