本文版權(quán)為《郵電設(shè)計技術(shù)》所有,如需轉(zhuǎn)載請聯(lián)系《郵電設(shè)計技術(shù)》編輯部
摘 要:針對復(fù)雜場景下輸電線路可視化監(jiān)控中目標(biāo)識別準(zhǔn)確率不高、誤檢誤報率較高的問題,提出了一種結(jié)合大模型的數(shù)據(jù)擴增和 YOLOv10優(yōu)化算法來提升復(fù)雜場景下目標(biāo)識別準(zhǔn)確率的實現(xiàn)方法。首先,針對樣本數(shù)據(jù)數(shù)量短缺的問題,基于Stable-diffusion大模型進行數(shù)據(jù)擴增,豐富并增加了樣本數(shù)量。其次,針對訓(xùn)練樣本數(shù)量有限的情況,對YOLOv10算法進行改進,進一步強化圖片特征的提取算法,優(yōu)化目標(biāo)識別算法,提升復(fù)雜自然場景下的目標(biāo)識別準(zhǔn)確率及性能。最終的實驗結(jié)果表明,與現(xiàn)有的實現(xiàn)方法相比,針對復(fù)雜場景的輸電線路的可視化監(jiān)控,對目標(biāo)識別的準(zhǔn)確率從原有的52.6%提升至54.3%。
關(guān)鍵詞:數(shù)據(jù)擴增;目標(biāo)識別;YOLO
doi:10.12045/j.issn.1007-3043.2024.09.006
概述
輸電線路的可視化監(jiān)控是保障電網(wǎng)安全運行的重要手段。通過在電力桿塔上架裝智能攝像頭,對輸電線路的環(huán)境安全、電力作業(yè)安全等進行實時、遠程和智能的監(jiān)控,這種方式已經(jīng)在電網(wǎng)運營企業(yè)中進行了大規(guī)模的應(yīng)用,并取得了不錯的效果,可以顯著提高輸電線路的安全性和運維效率。然而,由于自然場景的復(fù)雜性,現(xiàn)有方案存在目標(biāo)識別的準(zhǔn)確性不高和及時性不夠的問題,誤撿、漏檢現(xiàn)象時有發(fā)生。例如,在復(fù)雜自然場景下,挖掘機在輸電走廊附近進行作業(yè),受樹木、建筑等物體的遮擋,或者攝像頭拍攝角度的影響,無法及時識別出挖掘機對輸電線路安全運行造成的潛在危害。產(chǎn)生這種問題的原因在于,這種智能視覺實現(xiàn)方案通; YOLO 等深度學(xué)習(xí)模型,通過大量的標(biāo)注圖片進行模型訓(xùn)練,形成最終的推理模型和算法。
國內(nèi)外的許多學(xué)者對基于深度學(xué)習(xí)的電力線路監(jiān)測技術(shù)都有過深入的研究,文獻[1]提出了新模型YOLO-2MCS 用于輸電線路走廊隱患目標(biāo)檢測,并使用混合數(shù)據(jù)增強策略對數(shù)據(jù)集進行有效擴充;文獻[2]提出一種基于改進型目標(biāo)檢測算法(YOLO v3)的絕緣子異物檢測方法,在實現(xiàn)中首先使用視頻分割算法和背景替換的方式對樣本數(shù)據(jù)進行了擴增;文獻[3]從近10年來基于深度學(xué)習(xí)的輸電線路視覺檢測方法的研究進展出發(fā),首先概述適用于輸電線路巡檢的深度卷積神經(jīng)網(wǎng)絡(luò),接著重點闡述基于深度卷積神經(jīng)網(wǎng)絡(luò)的輸電線路巡檢圖像數(shù)據(jù)的目標(biāo)檢測,最后指出基于深度學(xué)習(xí)的輸電線路巡檢圖像數(shù)據(jù)視覺檢測方法目前存在樣本均衡性、小目標(biāo)檢測等方面的問題。文獻[4]對基于計算機視覺和深度學(xué)習(xí)的電力線路巡檢方案及數(shù)據(jù)來源問題進行了總結(jié)和回顧,提出了一種新的基于自主視覺的電力線路巡檢概念。綜上,在基于深度學(xué)習(xí)的電力線路監(jiān)控和巡檢應(yīng)用中,研究人員始終面臨著如下挑戰(zhàn):樣本數(shù)據(jù)獲取困難,由于電網(wǎng)運營安全性要求很高,管理措施也比較嚴(yán)格,加之這種影響電網(wǎng)安全的作業(yè)行為并不經(jīng)常發(fā)生,所以很難獲取到大量的訓(xùn)練樣本數(shù)據(jù)來訓(xùn)練模型;復(fù)雜場景下的目標(biāo)識別問題,包括復(fù)雜的自然場景下電力線路危害監(jiān)測和預(yù)警,以及電網(wǎng)小目標(biāo)識別問題,如絕緣子粉化、小金具銹蝕、導(dǎo)線斷股、M銷松動等。
針對訓(xùn)練樣本數(shù)據(jù)短缺的問題,現(xiàn)有方案通常采用數(shù)據(jù)擴增的方法來改進[5-12]。文獻[5]采用光照變換、噪聲變換、旋轉(zhuǎn)變換、平移變換等傳統(tǒng)圖像處理方法來對原始樣本數(shù)據(jù)集進行擴充,文獻[6]采用生成對抗網(wǎng)絡(luò)技術(shù)來進行數(shù)據(jù)擴增,文獻[7-8]通過圖像的鏡像、翻轉(zhuǎn),以及改變原始圖像的大小、亮度和模糊度來擴增訓(xùn)練數(shù)據(jù)集;文獻[9-10]通過調(diào)整圖像的飽和度、曝光度和色調(diào)來生成更豐富的樣本。文獻[11]使用去噪擴散概率模型提取出域外數(shù)據(jù)中的背景知識,將電力設(shè)備在真實樣本中的位置知識遷移到背景知識,從而生成具有較復(fù)雜背景的人工圖像。
以上這些數(shù)據(jù)擴增的實現(xiàn)方法,總體上可以分為2類,一類是基于傳統(tǒng)圖像處理的數(shù)據(jù)擴增技術(shù),另一類是基于深度學(xué)習(xí)網(wǎng)絡(luò)的數(shù)據(jù)庫擴增。本文將針對電力復(fù)雜場景下的目標(biāo)識別問題,提出一種基于大模型內(nèi)容生成技術(shù)的數(shù)據(jù)擴增方法,同時,針對這些包含真實樣本數(shù)據(jù)和擴增生成數(shù)據(jù)的復(fù)雜場景下的目標(biāo)識別,改進 YOLOv10 算法,從而提升了目標(biāo)識別的準(zhǔn)確性。