日前,由國家發改委批準,中國中小企業協會發起,聯合中國銀行業協會等國家級行業協會共同舉辦的第九屆中國中小企業投融資交易會在北京順利開幕。其中,“2021年金融服務中小微企業案例征集活動”結果正式揭曉,易道博識憑借“智能結構化平臺”獲得“2021年金融服務中小微企業優秀案例”榮譽。
本次案例征集活動得到了中國銀行業諸多金融機構和科技企業的積極響應和火熱參與,共收到308家金融機構和科技企業申報的478個案例。征集活動邀請了權威專家評委,對申報案例進行全方位的細致評審,提煉總結金融機構運用數字化手段打通融資難點、堵點,提升金融服務的覆蓋率、可得性、滿意度的各類嘗試、經驗和做法,有力樹立金融機構支持中小微企業的典范。
解決90%以上的識別需求,且自主可控
隨著銀行業務的發展,越來越多的業務線中涉及的紙質憑證影像需要用到OCR自動處理,來進一步提升業務辦理的效率。
這些憑證影像按照格式可以分為兩類:一類是固定格式的憑證(戶口本、港澳臺身份證、外國人永久居留證等);一類是非固定格式的憑證(銀行流水等)。其中固定格式業務類憑證占行內90%以上,這些憑證存在以下特點:
種類多:行內在各個業務受理過程中涉及到的憑證都在百種以上,甚至多達幾百種;
更新頻繁:不少憑證會隨著業務需求或者監管制度的變化而調整格式。
基于以上特點,對憑證的OCR識別工作就特別復雜。目前存在兩種解決方案:
一種是委托技術提供商做定制開發:按照憑證種類委托OCR廠商進行定制開發,逐一支持各類憑證;
另一種,是基于OCR底層能力進行自研:基于OCR廠商提供的底層識別能力(文字、表格、手寫體、印章等識別能力),自己投入研發力量從代碼層面開發針對各類票據的OCR功能。
不過,以上兩種方式均存在一些缺陷:第一種方案,持續投入高,需要廠商就每一種憑證進行定制化開發。第二種方案,成本投入更高,不僅需要采購廠商底層能力,而且需要OCR專家團隊的支持。因此,銀行迫切需要一個能夠減少后續投入,自主可控的解決方案。
易道博識智能結構化平臺(簡稱平臺),基于深度學習的計算機視覺技術,自動從非結構化數字信息中抽取目標數據。模板定制過程簡單、直觀,無需硬編碼,全程可視化操作。只要將需要提取的信息選出加入訓練即可,一個版式5-10分鐘可完成,并且根據答案進行模板自行調整,不斷提升結構化水平。
這種方案可以解決銀行90%以上的固定格式業務憑證的識別,為銀行已搭建的識別平臺提供結構化方法,實現有效降低信息提取和錄入的人力成本。
切實降本增效,3大系統日均人工錄入量降至1%以下
在某銀行上線OCR智能識別平臺后,陸續有多個業務系統與OCR智能識別平臺對接,各系統應用OCR前后對比圖如下:
在集成智能結構化平臺之前,很多業務系統需要多人錄入數據,耗時長、效率低、出錯率高;在應用平臺之后,只需要將電子憑證上傳至平臺,平臺可直接將電子化信息轉換為可編輯數據并返回至業務系統,實現了錄入信息的自動化,幾乎完全替代人工錄入,極大改善客戶體驗。
而且,平臺通過對銀行憑證的定制化訓練,實現數據結構化目的,生成的模型仍在原OCR平臺運行,架構保持不變。流程及步驟如下:
在智能結構化平臺中,智能模板管理系統的主要功能是快速生成目標版式的結構化模板,為識別平臺提供結構化方法,并在本系統中存儲和管理這些模板。通過智能模板系統的可視化界面,可以定義模板的輸出字段,并進行必要的圖像標注工作,從而為智能模板算法提供元數據。
步驟一:模塊配置界面
模塊配置界面可以增加/刪除模塊,也能為模塊增加/刪除版式。
一個模型下可以定義任意數量的模塊,單個模塊下又可以包含數個版式。需要特別說明的是,模型的概念相當于一個統一的接口,通過固定的接口滿足自己的識別需求。
模塊的概念相當于樣本的類別,如身份證、軍官證、結婚證、完稅證明、營業執照等。版式的概念相當于樣本類別下不同的樣式,如營業執照下有橫版格式和豎版格式。
步驟二:標注頁面
每一個版式都需要上傳樣本并標注,將需要提取的數據標記出來。
步驟三:模型構建-生成模型界面
所有樣本標注完成后,便可以生成模型。
步驟四:模型的部署和測試界面
模型構建完成后,可以部署該模型到識別平臺,并測試模型的效果。
智能結構化平臺用于訓練產生針對各種不同版式的OCR識別引擎,滿足銀行自動化、專業化、模塊化、高性能等業務及技術要求,支持身份證、銀行卡等固定版式的結構化,營業執照等多版式的結構化,銀行回單、長途客運票等非固定版式的結構化,支持銀行單據分類+識別等分類結構化。
銀行各個業務受理過程中涉及到的憑證都在百種以上,甚至多達幾百種,且更新頻繁,不少憑證會隨著業務需求或者監管制度的變化而調整格式。建設智能結構化平臺可帶來以下幾點收益:
1、持續投入成本大幅減少,行內持續投入成本大幅減少,大幅節省人員投入,且準確率顯著提高。
2、新增憑證的開發投產時間大大縮減,以往行內新增項目的從采購、廠商入場開發、到上線,整個流程需要2個月以上。上線智能結構化平臺后,5-10分鐘完成新增憑證模板定制,當天就可完成模型的投產使用。
3、行內完全自主可控,使用平臺開發的OCR憑證模型可以形成自有知識產權。
智能結構化平臺可實現行內新增業務憑證的OCR識別自主可控,從新增一個憑證模板定制、自訓練到測試上線,完全可由行內人員自主完成,無需廠商干預。解決了行內新增板式OCR識別需要重新采購或廠商定制開發的工作和費用投入問題。
作為計算機視覺領域的重要分支,借助智能結構化平臺可實現行內90%以上的固定版式業務憑證的自主定制,構建的OCR憑證模型識別率可達98%以。系統成熟且實施可行性高,系統開發完成后,將為各業務系統提供支撐服務,實現降低人工成本、提高工作效率的目標。