AI-大模型的可行性驗(yàn)證

0 評(píng)論 3034 瀏覽 4 收藏 9 分鐘

大模型作為當(dāng)前的前沿技術(shù),有著強(qiáng)大的計(jì)算能力和復(fù)雜的數(shù)據(jù)處理能力,但是,面對(duì)大規(guī)模數(shù)據(jù)和高復(fù)雜度任務(wù),模型的可行性如何?本文希望為大家提供了一個(gè)全面的視角,揭示了AI大模型在理論和實(shí)踐中的潛力。

隨著信息技術(shù)的飛速發(fā)展,人工智能(AI)逐漸從科幻走向現(xiàn)實(shí),成為驅(qū)動(dòng)現(xiàn)代社會(huì)變革的核心力量。

AI大模型作為這一領(lǐng)域的前沿技術(shù),憑借其強(qiáng)大的計(jì)算能力和復(fù)雜的數(shù)據(jù)處理能力,正引領(lǐng)著技術(shù)創(chuàng)新的潮流。

然而,面對(duì)大規(guī)模數(shù)據(jù)和高復(fù)雜度任務(wù),這些模型的可行性和有效性究竟如何?

本文希望為大家提供了一個(gè)全面的視角,揭示了AI大模型在理論和實(shí)踐中的潛力。

那么今天我們要做的是基于大模型進(jìn)行證件過(guò)期,來(lái)進(jìn)行實(shí)現(xiàn)思路構(gòu)思和選型。

一、目標(biāo)

基于身份證圖片判斷其是否過(guò)期。

二、OCR技術(shù)

OCR(Optical Character Recognition,光學(xué)字符識(shí)別)技術(shù)可以將各種票據(jù)、報(bào)刊、書(shū)籍、文稿及其他印刷品的文字通過(guò)掃描轉(zhuǎn)化為圖像信息,并利用文字識(shí)別技術(shù)將圖像信息轉(zhuǎn)化為可使用的文本。這項(xiàng)技術(shù)可以幫助我們從身份證圖片中提取出有效的文字信息,用于后續(xù)的過(guò)期判斷。

OCR:OCR技術(shù)是光學(xué)字符識(shí)別的縮寫(xiě)(Optical Character Recognition),是通過(guò)掃描等光學(xué)輸入方式將各種票據(jù)、報(bào)刊、書(shū)籍、文稿及其他印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識(shí)別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的文本的計(jì)算機(jī)輸入技術(shù)—–掃描圖片轉(zhuǎn)文字。

第一步:數(shù)據(jù)集準(zhǔn)備

數(shù)據(jù)集準(zhǔn)備-日常生活中首先我們收集身邊人員。

#手機(jī)內(nèi)容:身份證、居住證等符合場(chǎng)景要求的身份信息:例如身份證、駕駛證、護(hù)照、居住證、港澳通行證等。

#收集數(shù)量:10-30張

“在收集到足夠的數(shù)據(jù)后,接下來(lái)我們要進(jìn)行數(shù)據(jù)匯總,以便后續(xù)的處理和分析?!?/p>

第二步:數(shù)據(jù)匯總

數(shù)據(jù)匯總方便我們后續(xù)對(duì)數(shù)據(jù)質(zhì)量評(píng)價(jià)和應(yīng)用,制作一個(gè)Excel表格,格式如下

首先我們可以將圖片上傳到云盤(pán),獲取圖片鏈接。第二列為OCR結(jié)果復(fù)制粘貼

進(jìn)去。

第三步:OCR提取

OCR 內(nèi)容提取可行性驗(yàn)證,并不需要開(kāi)發(fā)代碼有界面,可操作交互的 OCR 產(chǎn)品即可騰訊 OCR:https://cloud.tencent.com/product/ocr

第四步:大預(yù)言模型能力提取所需的關(guān)鍵信息

OpenAI 的 platform 平臺(tái)舉例:https://platform.openai.com/playground?mode=chat可選擇其他大語(yǔ)言模型,要求可以設(shè)置prompt,可以調(diào)整模型、參數(shù)。

注釋?zhuān)骸癙rompt工程是一種設(shè)計(jì)和改進(jìn)AI提示的方法,以提高AI的表現(xiàn)?!?/strong>

Prompt Engineering 是一種人工智能(AI)技術(shù),它通過(guò)設(shè)計(jì)和改進(jìn) AI 的 prompt來(lái)提高 AI 的表現(xiàn)。Prompt Engineering的目標(biāo)是創(chuàng)建高度有效和可控的 AI 系統(tǒng),使其能夠準(zhǔn)確、可靠地執(zhí)行特定任務(wù)。

因?yàn)槿祟?lèi)的語(yǔ)言從根本上說(shuō)是不精確的,目前機(jī)器還沒(méi)法很好地理解人類(lèi)說(shuō)的話,所以才會(huì)出現(xiàn) Prompt 工程這個(gè)技術(shù)。

·如果你是產(chǎn)品設(shè)計(jì)師,或者研發(fā)人員,你可以通過(guò)它來(lái)設(shè)計(jì)和改進(jìn)AI系統(tǒng)的提示,從而提高AI系統(tǒng)的性能和準(zhǔn)確性,為用戶帶來(lái)更好的AI體驗(yàn)。

第五步:迭代調(diào)優(yōu)

輸入OCR內(nèi)容—查看結(jié)果—-調(diào)整Prompt—調(diào)整模型/參數(shù)—最后統(tǒng)一輸出所有。

第六步:完善數(shù)據(jù)

把第三列輸出結(jié)果補(bǔ)充進(jìn)去,人工判斷第四列是True正確還是False錯(cuò)誤

第七步:整體效果評(píng)估

匯總樣本統(tǒng)計(jì) :樣本數(shù)20

1. 精確率:95%

2. 召回率:100

精確率:對(duì)預(yù)測(cè)結(jié)果為正的樣本中實(shí)際正確的個(gè)數(shù)

召回率:實(shí)際正樣本中有多少被預(yù)測(cè)了回來(lái)

例如:面前有很多只狗和貓,扔一只骨頭出去希望狗能跑過(guò)來(lái)精確率就是所有跑回來(lái)的動(dòng)物中有多少只是狗,10只跑回來(lái),其中有8只狗,精確率80%在所有的動(dòng)物中有20只狗,召回率就是8/20.

綜上所述,通過(guò)《AI-大模型的可行性驗(yàn)證》,我們深入探討了如何利用AI大模型和OCR技術(shù)來(lái)判斷身份證是否過(guò)期。整個(gè)過(guò)程包括數(shù)據(jù)收集、OCR提取、模型應(yīng)用及結(jié)果評(píng)估,展示了AI大模型在處理復(fù)雜數(shù)據(jù)任務(wù)中的優(yōu)異表現(xiàn)。

在實(shí)際應(yīng)用中,我們成功實(shí)現(xiàn)了高精度的身份證過(guò)期判斷。在測(cè)試的20個(gè)樣本中,我們達(dá)到了95%的精確率和100%的召回率,充分證明了AI大模型的潛力。例如,通過(guò)OCR技術(shù),我們準(zhǔn)確提取了身份證上的有效期信息,并通過(guò)大語(yǔ)言模型的分析,準(zhǔn)確判斷出身份證是否過(guò)期。

然而,在這個(gè)過(guò)程中也遇到了一些挑戰(zhàn)。例如,部分OCR結(jié)果存在誤識(shí)別問(wèn)題,特別是在處理模糊或低質(zhì)量圖片時(shí)。此外,Prompt工程的設(shè)置和模型參數(shù)的調(diào)優(yōu)也需要不斷嘗試和優(yōu)化,以獲得最佳的判斷結(jié)果。面對(duì)這些挑戰(zhàn),我們通過(guò)不斷迭代和改進(jìn),逐步提高了系統(tǒng)的準(zhǔn)確性和可靠性。

盡管如此,我們?nèi)孕枥^續(xù)優(yōu)化技術(shù),解決在圖像質(zhì)量和識(shí)別準(zhǔn)確性方面的不足,并加強(qiáng)對(duì)AI模型的道德審查和安全性測(cè)試。未來(lái),隨著技術(shù)的進(jìn)一步發(fā)展,AI大模型有望在更多領(lǐng)域?qū)崿F(xiàn)突破,帶來(lái)更多創(chuàng)新和便利。

本文由 @李雪亮 投稿發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!