小語種文字識別服務(wù)-阿里云市場

小語種文字識別服務(wù)-阿里云市場

專用API
【更新時間: 2024.08.02】 阿里云小語種文字識別能夠支持國際主流幾大語系的自動語言分類判定并返回對應(yīng)語言的文字信息。語言檢測覆蓋十余個國家地區(qū)語種,適用于國際化所需的各類圖文識別與信息翻譯場景。
免費 (200次/月) 去服務(wù)商官網(wǎng)采購>
瀏覽次數(shù)
1.1K
采購人數(shù)
1
試用次數(shù)
1
! SLA: N/A
! 響應(yīng): N/A
! 適用于個人&企業(yè)
試用
收藏
×
完成
取消
×
書簽名稱
確定
<
產(chǎn)品介紹
>

什么是阿里云市場的小語種文字識別服務(wù)?

阿里云小語種文字識別服務(wù)是一種基于阿里云計算平臺的OCR解決方案,旨在處理和識別多種小語種文本。該服務(wù)通過先進的機器學(xué)習(xí)和人工智能技術(shù),對圖片、掃描件和手寫文本等進行高精度的文字識別。其核心技術(shù)包括圖像預(yù)處理、文字檢測、字符識別和語言模型優(yōu)化,使其在處理復(fù)雜背景、模糊字符和不規(guī)則排版時仍能保持高準確率。用戶只需將包含小語種文本的圖片上傳到阿里云平臺,即可快速獲得文本內(nèi)容,為多語言業(yè)務(wù)運營提供了便捷的支持。

什么是阿里云市場的小語種文字識別服務(wù)接口?

由服務(wù)使用方的應(yīng)用程序發(fā)起,以Restful風(fēng)格為主、通過公網(wǎng)HTTP協(xié)議調(diào)用阿里云市場的小語種文字識別服務(wù),從而實現(xiàn)程序的自動化交互,提高服務(wù)效率。

阿里云市場的小語種文字識別服務(wù)有哪些核心功能?

通用多語言識別

讀光通用多語言識別能夠支持國際主流幾大語系的自動語言分類判定并返回對應(yīng)語言的文字信息。語言檢測覆蓋十余個國家地區(qū)語種,適用于國際化所需的各類圖文識別與信息翻譯場景。

英語專項識別

讀光OCR英文專項識別是針對全英文圖片文檔場景下英文印刷體字符高效檢測和識別的原子能力產(chǎn)品,具備英文專項識別和英文分詞功能,支持旋轉(zhuǎn)、表格、文字坐標等多項基礎(chǔ)功能,全英文文檔字符識別率超過99%。

 

日語識別

讀光OCR日語識別是針對全日文圖片文檔場景下日文印刷體高效檢測和識別的原子能力產(chǎn)品,支持旋轉(zhuǎn)、表格、文字坐標等多項基礎(chǔ)功能。

俄語識別

讀光OCR俄語識別是針對圖片文檔場景下俄文印刷體高效檢測和識別的原子能力產(chǎn)品,支持旋轉(zhuǎn)、表格、文字坐標等多項基礎(chǔ)功能。

韓語識別

讀光OCR韓語識別是針對圖片文檔場景下韓文印刷體高效檢測和識別的原子能力產(chǎn)品,支持旋轉(zhuǎn)、表格、文字坐標等多項基礎(chǔ)功能。

泰語識別

讀光OCR泰語識別是針對泰語圖片文檔場景下泰文印刷體高效檢測和識別的原子能力產(chǎn)品,支持旋轉(zhuǎn)、表格、文字坐標等多項基礎(chǔ)功能。

拉丁語識別

讀光OCR拉丁語識別是針對拉丁語系的圖片文檔場景下印刷體高效檢測和識別的原子能力產(chǎn)品,支持旋轉(zhuǎn)、表格、文字坐標等多項基礎(chǔ)功能。可識別英語,德語,西班牙,法語,意大利語,葡萄牙語,馬來西亞語,印尼語,土耳其語,越南語等語種。

 

阿里云市場的小語種文字識別服務(wù)的核心優(yōu)勢是什么?

準確率高
利用海量的圖片樣本訓(xùn)練模型,具有超高的準確率 

實時性高
依托于阿里自建的EAS在線服務(wù)集群,提供彈性伸縮的低延時服務(wù)

技術(shù)前沿精深
基于阿里云機器學(xué)習(xí)平臺PAI,訓(xùn)練出的文本檢測及識別模型

服務(wù)穩(wěn)定
提供彈性服務(wù),擴展性好,算法持續(xù)的迭代優(yōu)化對用戶穩(wěn)定性無影響

       

在哪些場景會用到阿里云市場的小語種文字識別服務(wù)?

信息翻譯
信息翻譯場景下需要支持覆蓋多個語系,讀光OCR支持國際主流幾大語系的自動語言分類判定并返回對應(yīng)語言的文字信息

能夠解決
適用于國際化所需的各類圖文識別與信息翻譯場景;語言檢測覆蓋十余個國家地區(qū)語種

 

商務(wù)公關(guān)
商務(wù)公關(guān)場景下需要多語言以及精準快速翻譯響應(yīng),讀光OCR支持國際主流幾大語系的自動語言分類判定并及時返回對應(yīng)語言的文字信息,語言檢測覆蓋十余個國家地區(qū)語種

能夠解決
方便商務(wù)人員處理多語言場景

教育領(lǐng)域

小語種識別服務(wù)在教育領(lǐng)域發(fā)揮著重要作用。它輔助語言學(xué)習(xí)者更好地理解和掌握小語種,提供實時的翻譯和解釋,幫助學(xué)生克服語言障礙,提高學(xué)習(xí)效率。

 

旅游行業(yè)

隨著旅游市場的多元化發(fā)展,小語種識別服務(wù)在旅游行業(yè)中變得越來越重要。我們的服務(wù)能夠提供詳盡的多語言旅游信息和指南,包括目的地介紹、文化習(xí)俗、旅行小貼士等,滿足不同語言背景游客的需求。

<
產(chǎn)品價格
>

產(chǎn)品規(guī)格-后付費按次調(diào)用

產(chǎn)品規(guī)格-預(yù)付費資源包

 

<
使用指南
>

案例:

通用多語言識別

接口說明

本接口適用場景

  • 阿里云通用多語言證識別,是阿里云官方自研 OCR 文字識別產(chǎn)品,適用于國際化所需的各類圖文識別與信息翻譯場景。
  • 阿里云 OCR 產(chǎn)品基于阿里巴巴達摩院強大的 AI 技術(shù)及海量數(shù)據(jù),歷經(jīng)多年沉淀打磨,具有服務(wù)穩(wěn)定、操作簡易、實時性高、能力全面等幾大優(yōu)勢。

本接口核心能力

分類 概述
圖像增強 默認支持圖像增強,包括圖像自動旋轉(zhuǎn)、畸變自動矯正、模糊圖片自動增強等能力。
多類型覆蓋 支持模糊、光照不均、透視畸變、任意背景等低質(zhì)量圖像識別。
高精度識別 總體識別準確率可達 98%。

如何使用本接口

步驟 概述
1

開通 通用文字識別 服務(wù)。開通服務(wù)前后,您可以通過體驗館免費體驗本功能識別效果。

 

2 購買小語種識別資源包。本 API 會贈送免費額度,可使用免費額度測試。
3 可以參照調(diào)試頁面提供的代碼示例完成 API 接入開發(fā)。接入完成后,調(diào)用 API 獲取識別結(jié)果。如果使用子賬號調(diào)用接口,需要阿里云賬號(主賬號)對 RAM 賬號進行授權(quán)。創(chuàng)建 RAM 用戶的具體操作,請參考:創(chuàng)建 RAM 用戶。文字識別服務(wù)提供一種系統(tǒng)授權(quán)策略,即 AliyunOCRFullAccess。具體授權(quán)操作,請參見在用戶頁面為 RAM 用戶授權(quán)。

重要提示

類型 概述
類型 概述
圖片格式
  • 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暫不支持 PDF 格式。
圖片尺寸
  • 圖片長寬需要大于 15 像素,小于 8192 像素。
  • 長寬比需要小于 50。
  • 如需達到較好識別效果,建議長寬均大于 500px。
  • 圖片尺寸過小,會影響識別精度。圖片內(nèi)單字大小在 10-50px 內(nèi)時,識別效果較好。
圖片大小
  • 圖片二進制文件不能超過 10MB。
  • 圖片過大會影響接口響應(yīng)速度,建議使用小于 1.5M 圖片進行識別,且通過傳圖片 URL 的方式調(diào)用接口。
其他提示
  • 接口響應(yīng)速度和圖片中的文字數(shù)量有關(guān),如果圖片中文字數(shù)量越多,接口響應(yīng)可能越慢。
  • 接口會自動處理反光、扭曲等干擾信息,但會影響精度。請盡量選擇清晰度高、無反光、無扭曲的圖片。
相關(guān)能力

示例

正常返回示例

 
 
{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\"content\":\"PACKING  Shipper/Export   Invoice No & Date  STM TECHNOLOGY INC. 20140730- ST44 \",\"height\":1753,\"orgHeight\":1753,\"orgWidth\":1240,\"prism_version\":\"1.0.9\",\"prism_wnum\":71,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":33,\"pos\":[{\"x\":348,\"y\":137},{\"x\":531,\"y\":135},{\"x\":532,\"y\":168},{\"x\":348,\"y\":170}],\"prob\":99,\"recClassify\":1,\"width\":184,\"word\":\"PACKING\",\"x\":348,\"y\":135}],\"width\":1240}",
  "Code": "200",
  "Message": "message"
}

詳情參考:https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-overview?spm=a2c4g.11186623.0.0.56ef139bT0vzZP#api-overview-94306-1

 

<
關(guān)于我們
>
豐富的企業(yè)應(yīng)用,滿足企業(yè)經(jīng)營和數(shù)字化所需 安全合規(guī) 亞太合規(guī)資質(zhì)最全的云服務(wù)商之一,從基礎(chǔ)設(shè)施安全、內(nèi)核平臺安全、系統(tǒng)服務(wù)安全、云安全產(chǎn)品四個層面,保障千行百業(yè)客戶的業(yè)務(wù)安全在線。擁有權(quán)威認可的原生安全能力,根據(jù)2021年Gartner報告,安全能力全球第一。 技術(shù)領(lǐng)先 飛天是阿里云自主研發(fā)、國內(nèi)唯一自研的云計算操作系統(tǒng),編排調(diào)度百萬級服務(wù)器,單集群調(diào)度規(guī)模超十萬臺,具備EB級數(shù)據(jù)存儲能力,并通過CIPU率先實現(xiàn)虛擬化“0”損耗,提供業(yè)界領(lǐng)先的計算性能,既滿足客戶嚴苛的業(yè)務(wù)要求,又提供高性價比服務(wù)。
聯(lián)系信息
服務(wù)時間: 7*24
電話號碼: 86 571 8502 2600

<
最可能同場景使用的其他API
>
API接口列表
<
產(chǎn)品價格
>

產(chǎn)品規(guī)格-后付費按次調(diào)用

產(chǎn)品規(guī)格-預(yù)付費資源包

 

<
使用指南
>

案例:

通用多語言識別

接口說明

本接口適用場景

  • 阿里云通用多語言證識別,是阿里云官方自研 OCR 文字識別產(chǎn)品,適用于國際化所需的各類圖文識別與信息翻譯場景。
  • 阿里云 OCR 產(chǎn)品基于阿里巴巴達摩院強大的 AI 技術(shù)及海量數(shù)據(jù),歷經(jīng)多年沉淀打磨,具有服務(wù)穩(wěn)定、操作簡易、實時性高、能力全面等幾大優(yōu)勢。

本接口核心能力

分類 概述
圖像增強 默認支持圖像增強,包括圖像自動旋轉(zhuǎn)、畸變自動矯正、模糊圖片自動增強等能力。
多類型覆蓋 支持模糊、光照不均、透視畸變、任意背景等低質(zhì)量圖像識別。
高精度識別 總體識別準確率可達 98%。

如何使用本接口

步驟 概述
1

開通 通用文字識別 服務(wù)。開通服務(wù)前后,您可以通過體驗館免費體驗本功能識別效果。

 

2 購買小語種識別資源包。本 API 會贈送免費額度,可使用免費額度測試。
3 可以參照調(diào)試頁面提供的代碼示例完成 API 接入開發(fā)。接入完成后,調(diào)用 API 獲取識別結(jié)果。如果使用子賬號調(diào)用接口,需要阿里云賬號(主賬號)對 RAM 賬號進行授權(quán)。創(chuàng)建 RAM 用戶的具體操作,請參考:創(chuàng)建 RAM 用戶。文字識別服務(wù)提供一種系統(tǒng)授權(quán)策略,即 AliyunOCRFullAccess。具體授權(quán)操作,請參見在用戶頁面為 RAM 用戶授權(quán)。

重要提示

類型 概述
類型 概述
圖片格式
  • 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暫不支持 PDF 格式。
圖片尺寸
  • 圖片長寬需要大于 15 像素,小于 8192 像素。
  • 長寬比需要小于 50。
  • 如需達到較好識別效果,建議長寬均大于 500px。
  • 圖片尺寸過小,會影響識別精度。圖片內(nèi)單字大小在 10-50px 內(nèi)時,識別效果較好。
圖片大小
  • 圖片二進制文件不能超過 10MB。
  • 圖片過大會影響接口響應(yīng)速度,建議使用小于 1.5M 圖片進行識別,且通過傳圖片 URL 的方式調(diào)用接口。
其他提示
  • 接口響應(yīng)速度和圖片中的文字數(shù)量有關(guān),如果圖片中文字數(shù)量越多,接口響應(yīng)可能越慢。
  • 接口會自動處理反光、扭曲等干擾信息,但會影響精度。請盡量選擇清晰度高、無反光、無扭曲的圖片。
相關(guān)能力

示例

正常返回示例

 
 
{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\"content\":\"PACKING  Shipper/Export   Invoice No & Date  STM TECHNOLOGY INC. 20140730- ST44 \",\"height\":1753,\"orgHeight\":1753,\"orgWidth\":1240,\"prism_version\":\"1.0.9\",\"prism_wnum\":71,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":33,\"pos\":[{\"x\":348,\"y\":137},{\"x\":531,\"y\":135},{\"x\":532,\"y\":168},{\"x\":348,\"y\":170}],\"prob\":99,\"recClassify\":1,\"width\":184,\"word\":\"PACKING\",\"x\":348,\"y\":135}],\"width\":1240}",
  "Code": "200",
  "Message": "message"
}

詳情參考:https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-overview?spm=a2c4g.11186623.0.0.56ef139bT0vzZP#api-overview-94306-1

 

<
依賴服務(wù)
>
<
關(guān)于我們
>
豐富的企業(yè)應(yīng)用,滿足企業(yè)經(jīng)營和數(shù)字化所需 安全合規(guī) 亞太合規(guī)資質(zhì)最全的云服務(wù)商之一,從基礎(chǔ)設(shè)施安全、內(nèi)核平臺安全、系統(tǒng)服務(wù)安全、云安全產(chǎn)品四個層面,保障千行百業(yè)客戶的業(yè)務(wù)安全在線。擁有權(quán)威認可的原生安全能力,根據(jù)2021年Gartner報告,安全能力全球第一。 技術(shù)領(lǐng)先 飛天是阿里云自主研發(fā)、國內(nèi)唯一自研的云計算操作系統(tǒng),編排調(diào)度百萬級服務(wù)器,單集群調(diào)度規(guī)模超十萬臺,具備EB級數(shù)據(jù)存儲能力,并通過CIPU率先實現(xiàn)虛擬化“0”損耗,提供業(yè)界領(lǐng)先的計算性能,既滿足客戶嚴苛的業(yè)務(wù)要求,又提供高性價比服務(wù)。
聯(lián)系信息
服務(wù)時間: 7*24
電話號碼: 86 571 8502 2600

<
最可能同場景使用的其他API
>