![]() |
Diggernaut 數(shù)據(jù)抓取
專(zhuān)用API
【更新時(shí)間: 2024.07.29】
與我們列表中的其他一些 API 一樣,Diggernaut API 旨在使幾乎任何人都可以訪問(wèn)以前的學(xué)術(shù)主題。雖然它已經(jīng)存在了很長(zhǎng)一段時(shí)間,但數(shù)據(jù)抓取在很大程度上是一種藝術(shù)形式,如果你沒(méi)有太多的編程經(jīng)驗(yàn),那就更是如...
9.99$/月
去服務(wù)商官網(wǎng)采購(gòu)>
|
瀏覽次數(shù)
19
采購(gòu)人數(shù)
0
試用次數(shù)
0
收藏
×
完成
取消
×
書(shū)簽名稱(chēng)
確定
|

- API詳情
- 定價(jià)
- 使用指南
- 關(guān)于我們
- 相關(guān)推薦


什么是Diggernaut 數(shù)據(jù)抓取?
Diggernaut 數(shù)據(jù)抓取API 是一個(gè)高效的工具,它使得從多個(gè)網(wǎng)站自動(dòng)收集數(shù)據(jù)變得簡(jiǎn)單,無(wú)需任何編程技能。它提供了靈活的配置選項(xiàng),支持從文本到圖像中提取信息,并能在用戶(hù)選擇的服務(wù)器上獨(dú)立運(yùn)行,從而節(jié)省時(shí)間并提高效率。
什么是Diggernaut 數(shù)據(jù)抓取接口?
Diggernaut 數(shù)據(jù)抓取有哪些核心功能?
1.從圖像中提取文本:我們有一個(gè) OCR 模塊,您可以將其與挖掘機(jī)一起使用,從圖像中提取文本。請(qǐng)注意,OCR 功能不適用于編譯的挖掘機(jī)。您只能將其用于在我們的云中運(yùn)行的挖掘機(jī)。
2. 處理頁(yè)面靈活:每個(gè)挖掘機(jī)都可以在一個(gè)或多個(gè)網(wǎng)站上處理多個(gè)頁(yè)面。因此,您的挖掘機(jī)可以從一頁(yè)跳到另一頁(yè),甚至跳到另一個(gè)網(wǎng)站并獲取您需要的所有數(shù)據(jù)。
3.整理數(shù)據(jù)集: Diggernaut 是一項(xiàng)基于云的服務(wù),用于網(wǎng)頁(yè)抓取、數(shù)據(jù)提取和其他 ETL(提取、轉(zhuǎn)換、加載)任務(wù)。如果您是商品經(jīng)銷(xiāo)商,并且您的供應(yīng)商不允許您以合適的格式(例如 Excel 或 CSV)獲取他們的數(shù)據(jù),則您被迫手動(dòng)從他們的網(wǎng)站檢索數(shù)據(jù)。 您需要做的就是創(chuàng)建一個(gè)挖掘機(jī),一個(gè)可以代表您進(jìn)行網(wǎng)絡(luò)抓取并為您從網(wǎng)站中提取數(shù)據(jù)、對(duì)其進(jìn)行規(guī)范化并將數(shù)據(jù)保存到云端的微型機(jī)器人。完成后,您可以下載 CSV、XLS、JSON 格式,甚至可以使用我們的 Rest API 檢索它。
|
|
|
Diggernaut 數(shù)據(jù)抓取的核心優(yōu)勢(shì)是什么?
1.極速數(shù)據(jù)收集:
使用 Diggernaut,您可以將數(shù)據(jù)收集過(guò)程加快一千倍,釋放您的時(shí)間,以便執(zhí)行更重要的任務(wù)。
2. 在自己的服務(wù)器上運(yùn)行:
您可以將挖掘機(jī)編譯成適用于 Windows、Linux 或 Mac 的可執(zhí)行文件,然后將該文件下載到您自己的計(jì)算機(jī)或服務(wù)器上以在那里運(yùn)行它。在您身邊運(yùn)行它不會(huì)被收取費(fèi)用;您可以根據(jù)需要多次運(yùn)行它。
3. 使用 Golang:
作為我們挖掘機(jī)的后端。由于 Golang 的編譯器可以生成快速高效的可執(zhí)行文件,與使用解釋型編程語(yǔ)言(例如 Python、Ruby、JS、Perl、PHP)編寫(xiě)的任何文件相比,您可以花費(fèi)更少的服務(wù)器資源來(lái)獲取更多數(shù)據(jù)。
4.面向多人群:
如果您沒(méi)有任何編程技能,您可以使用我們的 Visual Extractor 工具為您的挖掘機(jī)構(gòu)建配置。它簡(jiǎn)單的點(diǎn)擊應(yīng)用程序,您可以在其中選擇要提取的數(shù)據(jù),并設(shè)置在輸出數(shù)據(jù)結(jié)構(gòu)中如何擁有它。我們有視頻課程解釋如何在我們的沙盒網(wǎng)站上使用它。
如果您是程序員或 Web 開(kāi)發(fā)人員,則可以使用元語(yǔ)言為挖掘機(jī)構(gòu)建配置。通過(guò)這種方式,您可以解決非常復(fù)雜的數(shù)據(jù)提取任務(wù)。我們有全面的元語(yǔ)言文檔,可幫助您適應(yīng)它;此外,我們的博客上還有很多帖子,展示了如何使用不同的元語(yǔ)言函數(shù)來(lái)解決不同的實(shí)際案例。
如果您只是不想在上面花費(fèi)任何時(shí)間,您可以聘請(qǐng)我們的開(kāi)發(fā)人員,他們將為您完成所有這些工作,您需要做的就是以請(qǐng)求的格式接收數(shù)據(jù)。


我們提供廣泛的服務(wù)水平
基本計(jì)劃:
企業(yè)計(jì)劃:


應(yīng)用程序接口
API 的主要目標(biāo)是促進(jìn)應(yīng)用程序與 Diggernaut 服務(wù)之間的自動(dòng)交互過(guò)程。 例如,使用 API,您可以自動(dòng)啟動(dòng)挖掘機(jī)并檢索數(shù)據(jù)。此外,您還可以將按需數(shù)據(jù)功能與 API 結(jié)合使用。 我們的 API 使用 REST 架構(gòu)。
任何對(duì) API 的 POST / PUT / PATCH 請(qǐng)求都必須以 application/json 格式發(fā)送數(shù)據(jù), 來(lái)自 API 的響應(yīng)也將以 application/json 格式發(fā)送。
版本
API 的當(dāng)前版本為版本 1。該文檔僅涵蓋 API 的當(dāng)前版本。 以前版本的 API 仍然受支持,但是,為了使用特定版本的 API,必須顯式指定它 在 URL 中。如果未指定版本,則將使用 API 的當(dāng)前版本。
認(rèn)證
REST API Diggernaut 使用基于訪問(wèn)令牌的簡(jiǎn)單用戶(hù)身份驗(yàn)證方案。令牌必須是 在需要授權(quán)的每個(gè)請(qǐng)求的標(biāo)頭中發(fā)送。標(biāo)頭示例如下所示:
當(dāng)您登錄您的帳戶(hù)時(shí),您可以在我們的網(wǎng)站上生成訪問(wèn)令牌。
限制
目前,API的訪問(wèn)限制為:每秒1個(gè)請(qǐng)求,每24小時(shí)1000個(gè)請(qǐng)求。






我們提供廣泛的服務(wù)水平
基本計(jì)劃:
企業(yè)計(jì)劃:


應(yīng)用程序接口
API 的主要目標(biāo)是促進(jìn)應(yīng)用程序與 Diggernaut 服務(wù)之間的自動(dòng)交互過(guò)程。 例如,使用 API,您可以自動(dòng)啟動(dòng)挖掘機(jī)并檢索數(shù)據(jù)。此外,您還可以將按需數(shù)據(jù)功能與 API 結(jié)合使用。 我們的 API 使用 REST 架構(gòu)。
任何對(duì) API 的 POST / PUT / PATCH 請(qǐng)求都必須以 application/json 格式發(fā)送數(shù)據(jù), 來(lái)自 API 的響應(yīng)也將以 application/json 格式發(fā)送。
版本
API 的當(dāng)前版本為版本 1。該文檔僅涵蓋 API 的當(dāng)前版本。 以前版本的 API 仍然受支持,但是,為了使用特定版本的 API,必須顯式指定它 在 URL 中。如果未指定版本,則將使用 API 的當(dāng)前版本。
認(rèn)證
REST API Diggernaut 使用基于訪問(wèn)令牌的簡(jiǎn)單用戶(hù)身份驗(yàn)證方案。令牌必須是 在需要授權(quán)的每個(gè)請(qǐng)求的標(biāo)頭中發(fā)送。標(biāo)頭示例如下所示:
當(dāng)您登錄您的帳戶(hù)時(shí),您可以在我們的網(wǎng)站上生成訪問(wèn)令牌。
限制
目前,API的訪問(wèn)限制為:每秒1個(gè)請(qǐng)求,每24小時(shí)1000個(gè)請(qǐng)求。





