您現(xiàn)在的位置是:首頁 >人工智能 > 2022-04-14 15:57:11 來源:
通過圖像處理和語義映射檢測學(xué)術(shù)抄襲
迫切需要解決學(xué)術(shù)界明顯日益嚴重的剽竊問題。在國際數(shù)據(jù)挖掘、建模和管理雜志上撰文,來自沙特阿拉伯的一個團隊專注于剽竊的一個特定方面,即作者使用從另一個來源竊取的圖像并將其作為自己的圖像假冒,而沒有對原始內(nèi)容創(chuàng)建者給予應(yīng)有的認可以及如何使用技術(shù)檢測到這一點。研究論文中的圖像和圖形可能代表艱苦的實驗數(shù)據(jù),甚至是研究中的核心概念,因此對科學(xué)努力至關(guān)重要。
位于阿西爾的哈立德國王大學(xué) Mahayil 的 Taiseer Abdalla Elfadil Eisa 解釋說,檢測研究出版物中使用的數(shù)字和圖像中的抄襲尤其具有挑戰(zhàn)性,不僅因為必要的分析和比較的復(fù)雜性,而且還因為大量每年在期刊上發(fā)表的研究論文。該研究著眼于一種可以分析論文中圖形的文本內(nèi)容和結(jié)構(gòu)的技術(shù)。Eisa 解釋說,采用了圖像處理和語義映射。
“在科學(xué)出版物中,定量信息、實驗結(jié)果、框架和統(tǒng)計事實以信息圖表的形式表示,例如數(shù)字、圖表和表格,而不是文本形式,”Eisa 解釋說。“然而,在科學(xué)出版物的這些非文本元素中檢測抄襲的關(guān)注較少。” 當(dāng)前的研究通過克服當(dāng)前文本匹配工具從圖像的非文本組件(例如流程圖)中提取信息以進行比較的限制,直接解決了這個問題。該方法可以識別圖像中的形狀,以文本形式描述圖像中的形狀及其關(guān)系,并使用這些形狀中任何文本的OCR(光學(xué)字符識別)對其進行注釋。
Eisa 寫道,該方法顯著改進了現(xiàn)有方法,以其他方法無法處理的方式解決了圖形中形狀內(nèi)的文本問題。