一、企業(yè)簡(jiǎn)介
金現(xiàn)代(300830)信息產(chǎn)業(yè)股份有限公司(以下簡(jiǎn)稱(chēng)“公司”),是國(guó)家鼓勵(lì)的重點(diǎn)軟件企業(yè),國(guó)家高新技術(shù)企業(yè),深交所創(chuàng)業(yè)板上市企業(yè)(證券簡(jiǎn)稱(chēng):金現(xiàn)代;證券代碼:300830)。公司致力于電力、軌道交通、石化、工業(yè)制造等行業(yè)管理軟件的研發(fā)與推廣,是國(guó)內(nèi)主要的行業(yè)信息化解決方案提供商,目前公司產(chǎn)品及服務(wù)已遍布全國(guó)22個(gè)省、5個(gè)自治區(qū)和4個(gè)直轄市,主要客戶包括國(guó)家電網(wǎng)、南方電網(wǎng)、五大發(fā)電集團(tuán)、國(guó)家鐵路集團(tuán)等世界500強(qiáng)企業(yè)。
【資料圖】
二、案例概述
工程圖紙廣泛用于火電、核電、水利、建筑、制造業(yè)等行業(yè)。工程圖紙對(duì)于設(shè)備和建筑故障、隱患的排查十分重要。因此,根據(jù)現(xiàn)場(chǎng)信息快速查詢工程圖紙成為一種廣泛需求。而受限于數(shù)字化改造的滯后,工程圖紙的信息往往保留在紙質(zhì)圖紙或單獨(dú)的圖紙電子文件中,無(wú)法通過(guò)數(shù)據(jù)庫(kù)進(jìn)行查詢,導(dǎo)致調(diào)閱一個(gè)工程圖紙常要花費(fèi)數(shù)天的時(shí)間,效率低下。此外,實(shí)物化的工程圖紙容易受潮和光照影響,保存時(shí)間短。因此迫切需要一種技術(shù)實(shí)現(xiàn)工程圖紙的電子化,實(shí)現(xiàn)工程圖紙信息的結(jié)構(gòu)化查詢。雖然在AI技術(shù)的不斷發(fā)展下,通用OCR模型在常規(guī)的文檔識(shí)別準(zhǔn)確率上已經(jīng)取得了極高的準(zhǔn)確率。但針對(duì)工程圖紙中物料編碼、元器件編號(hào)的文字識(shí)別,通用OCR模型在圖紙中的文字檢測(cè)識(shí)別中識(shí)別準(zhǔn)確率不佳,存在誤識(shí)別、漏識(shí)別等問(wèn)題。造成這種問(wèn)題主要是因?yàn)閳D紙圖像的尺寸很大而文字尺寸很小、文字與符號(hào)框貼合較近、部分器件符號(hào)容易被誤識(shí)別為文字、以及文字分布隨意方向隨意等。
金現(xiàn)代提供的方案使用深度學(xué)習(xí)、圖像處理等關(guān)鍵技術(shù),使用多種策略構(gòu)建和增廣數(shù)據(jù)集,并自主研發(fā)訓(xùn)練文字檢測(cè)和文字識(shí)別模型,解決了小尺寸文字識(shí)別、漏識(shí)別、誤識(shí)別等問(wèn)題,最終提升了圖紙中文字檢測(cè)與識(shí)別的準(zhǔn)確率和效率,為圖紙電子化數(shù)據(jù)的檢索和應(yīng)用發(fā)揮了不可替代的作用。
圖1圖紙圖像示例
圖2圖紙檢測(cè)與識(shí)別結(jié)果
三、’應(yīng)用成效
(1)單張圖紙識(shí)別速度<1s,提供圖紙識(shí)別服務(wù)接口。
(2)適用于膠片、紙質(zhì)等不同類(lèi)型的圖紙。
(3)客戶圖紙查詢方式全面接入業(yè)務(wù)系統(tǒng)。與原有手工查詢方式相比,查詢速度由數(shù)天提升到秒級(jí),效率提升上千倍。
(4)圖紙識(shí)別準(zhǔn)確度>98%。
四、應(yīng)用場(chǎng)景
本方案在設(shè)計(jì)研究院等單位中為設(shè)計(jì)圖紙的電子化檢索應(yīng)用發(fā)揮了極大的作用,對(duì)傳統(tǒng)圖紙管理服務(wù)的轉(zhuǎn)型升級(jí)起到了示范作用,有效降低了管理人員數(shù)量,提高借閱效率和服務(wù)水平,具有廣闊的應(yīng)用推廣前景。
五、主要?jiǎng)?chuàng)新點(diǎn)
(1)實(shí)現(xiàn)圖紙中小目標(biāo)文本的檢測(cè)。
(2)結(jié)合目標(biāo)檢測(cè)技術(shù),解決元器件符號(hào)易誤識(shí)別為文字的問(wèn)題。
(3)結(jié)合圖像處理技術(shù),解決堆疊文字檢測(cè)準(zhǔn)確率較低的問(wèn)題。
(4)構(gòu)建圖紙專(zhuān)用數(shù)據(jù)集,微調(diào)文字識(shí)別模型擴(kuò)增字符識(shí)別種類(lèi)。
六、后續(xù)規(guī)劃
在OCR領(lǐng)域,我們將繼續(xù)加強(qiáng)人工智能的研究,并結(jié)合用戶實(shí)際需求,積極拓展其在更多領(lǐng)域的嘗試和應(yīng)用,以進(jìn)一步為企業(yè)降低成本、提高效率,并提供更多滿意的解決方案。