2025.11
Terahertz & Deep Learning:
A New Era in Non-Destructive Historical Document Analysis
文/ 郭志玲
編/ 謝明翰
一、引言
歷史文獻不僅記錄著過往的重要資訊,也承載著文化遺產的價值。然而,隨著時間推移,許多珍貴文獻因老化或外界影響而變得極為脆弱,無法以傳統方式翻閱和檢查。太赫茲(Terahertz, THz)影像技術是一種非侵入性、非破壞性的三維成像技術,能透過文獻表層而不損害其結構,成為文獻分析的重要工具。然而,太赫茲技術在應用中仍面臨著圖像分辨率低、噪聲干擾等挑戰。為此,研究者試圖增進透視分層結構成像技術並將深度學習技術引入太赫茲圖像處理領域,顯著提升了其檢測效率與結果準確性。
二、太赫茲技術的基礎原理與應用
太赫茲波是指頻率範圍在 0.1 THz 至 10 THz(波長為 100 微米至 1 毫米)之間的電磁波,其位於紅外線與微波之間,具有以下特性:
高穿透性:太赫茲波能夠穿透非金屬材料,如紙張、織物、塑膠等,適合檢測隱藏在內部的信息。
非電離性:與X射線不同,太赫茲波能量較低,不會對材料造成結構破壞。
高頻率分辨率:適合檢測細微結構和材料特性差異。
這些特性使太赫茲波成為無損檢測的重要工具,廣泛應用於安全檢測、醫學成像、材料分析及文化遺產保護等領域。然而,太赫茲圖像的應用也面臨挑戰:
圖像分辨率低:由於波長較長,太赫茲波的成像分辨率遠低於可見光。
雜訊干擾嚴重:太赫茲影像易受到背景雜訊影響,需進行後期處理以提升品質。
三、透視分層結構成像技術 — 太赫茲時域光譜(THz-TDS)
太赫茲影像的核心原理在於通過太赫茲波與物體的相互作用,獲取其內部結構的訊息。具體來說,太赫茲波在穿透材料時,會因材料密度、厚度及結構產生反射和散射,這些訊號經處理後生成影像。太赫茲時域光譜是一種無損光譜測量技術,具有 3D 成像能力,利用短脈衝的太赫茲電磁輻射來檢測樣品特性。與常用於檢測文物、藥品及複合結構等層狀物體的 X 射線斷層掃描及超音波技術相比,太赫茲時域光譜提供了更高的分辨率及寬頻光譜特徵。
而在針對由字母組成的30層紙疊進行測量的實驗之中,太赫茲脈衝通過透鏡發射並聚焦於樣品中,反射的太赫茲信號由來自不同界面的脈衝組成,這些脈衝能夠捕捉和反射太赫茲信號,並提供飛行時間 (ToF, Time of Flight) 及反射率資訊。透過分析脈衝位置來重建樣品的層結構,並確定適合進行橫向成像的時間範圍。科學家對比了不同脈衝提取技術的結果,並成功從點中提取初分層的界面,以重建層狀樣品的結構。接著,透過提取相應脈衝的幅度訊息,獲得了各層的太赫茲圖像,成功清楚地識別所有單字。
圖二、太赫茲成像資訊擷取過程示意圖。Science Advances, doi: 10.1126/sciadv.adg8435
圖二是太赫茲成像資訊擷取過程示意圖。測量採用太赫茲時域光譜(THz-TDS)在反射模式下進行光柵掃描。由數十個脈衝組成的反射訊號提供了樣品的飛時測距(ToF :Time of Flight)和反射率訊息,可用於後續的重建和各層內的成像。每層的太赫茲影像。該方法成功地獲得了具有高對比度和一致性的分層影像。
圖三、太赫茲成像結果的評估Science Advances, doi: 10.1126/sciadv.adg8435
四、深度學習如何解決這些問題
生成對抗網絡(GAN)技術
GAN 是一種基於博弈論的深度學習框架,通過生成器和辨別器的對抗訓練,能夠生成與真實數據分佈一致的樣本。對於太赫茲圖像,GAN 可用於:
超分辨率重建:使用無監督學習模型 CycleGAN,適用於無對應配對資料的影像轉換問題,其核心為兩個生成器Ga和Gb,分別負責將清晰影像轉換為噪聲影像,以及反向操作 — 將低分辨率的太赫茲影像轉換為高分辨率影像,改善細節表現。
圖像去噪:基於 Pix2pixGAN 的監督式學習方法,是一種條件GAN(Conditional GAN),能將噪聲影像直接轉換為清晰影像,利用透過CycleGAN所生成的成對高噪聲與低噪聲圖像進行訓練,顯著提升太赫茲影像品質。
卷積神經網絡(CNN)技術:
CNN 在影像處理中的應用包括:
特徵提取:通過多層卷積操作,提取影像的高階特徵,用於分類或分割。
影像增強:結合 CNN 的超分辨率模型可用於提升太赫茲影像的空間分辨率。
例如,研究者將 CNN 應用於古代手稿的字跡增強,成功提升了文字辨識率,並降低了人工處理的需求。
深度學習與太赫茲技術的實驗案例
為解決真實數據不足的問題,研究利用手寫字生成器產生2000張清晰手寫影像,此外利用一般紙以及宣紙進行實驗,透過CycleGAN模擬噪聲影像並確認合成影像的特徵分佈接近真實影像,並使用這些配對影像訓練Pix2pixGAN 生成合成數據集:
CycleGAN:使用ResNet作為生成器,PatchGAN作為辨別器,學習率為0.0002,訓練200個epoch。
Pix2pixGAN:使用U-Net作為生成器,批量大小為5,學習率為0.0002,權重λ設為100。這些合成數據被用於訓練 Pix2pixGAN 模型,實現高效的影像去噪。
在模型性能評估中,研究者比較了多種方法對太赫茲圖像去噪的效果:
傳統濾波方法:如雙邊濾波(Bilateral Filter)、加權全變分(weighted total variation WTV),其對高頻噪聲有一定抑制效果,但無法處理結構化雜訊。
深度學習方法:如 CycleGAN 、Pix2pixGAN 和 HINet,顯著提升了圖像的清晰度和文字辨識率。
具體結果顯示,Pix2pixGAN 的文字辨識率達到 99%,在噪聲抑制及字符辨識準確性上均表現最佳,而傳統方法僅為 42%。
圖四、Te CycleGAN和Pix2pixGAN對於分別寫在宣紙和一般紙上的太赫茲圖像辨識結果
圖五、使用不同演算法進行雜訊去除,太赫茲影像中字元辨識的準確性和PI分數
五、研究現狀
太赫茲技術在文物與歷史文獻保護中的應用已取得諸多成果。例如:
隱藏文字的檢測:研究者使用太赫茲時域光譜技術成功讀取封閉信件內部的文字內容,無需拆開信封。
文物結構的成像:研究者檢查了具有分層結構的壁畫或油畫等文化藝術品,以檢測藝術品的內部缺陷和隱藏的油漆層,以收集結構的隱藏資訊,並研究了研究西安秦始皇陵8000 個兵馬俑的結構和老化狀況以保護和修復兵馬俑的潛力。
圖六、兵馬俑的應用。 (A) 出土的陶俑(B) 戰士碎片的結構重建和厚度測量。 © 底部表面的太赫茲成像。Science Advances, doi: 10.1126/sciadv.adg8435
深度學習與太赫茲技術的未來展望
多模態融合:結合 X 射線、紅外線等技術,實現更全面的文物分析。
自監督學習:對特定結構化雜訊,開發適合太赫茲數據特性的自監督模型,減少對標註數據的依賴。
實時處理技術:提高太赫茲影像處理的速度,實現實時分析應用。
六、結論
深度學習技術正在重塑太赫茲影像的應用,尤其在歷史文獻的無損分析中表現出色。生成對抗網絡(GAN)的引入突破了雜訊和數據稀缺的瓶頸,顯著提升影像品質和分析準確度。太赫茲技術與深度學習的結合,不僅為文化遺產的保護與研究提供了全新解決方案,也為文物修復、藝術品鑑定及數字化保存開啟了更多可能。隨著技術的進步,太赫茲技術有望在未來發揮更加關鍵的作用,推動文化遺產保護邁向新紀元。
參考資料:
1. Balaka Dutta et al., “Deep learning for terahertz image denoising in nondestructive historical document analysis”, in Scientifc Reports (2022) 12:22554
2. Yuqing Cui et al, “Hidden-information extraction from layered structures through terahertz imaging down to ultralow SNR”, in Science Advances (2023). DOI: 10.1126/sciadv.adg8435
3. Albert Redo-Sanchez et al, “Terahertz time-gated spectral imaging for content extraction through layered structures”, in Nature Communications (2016). DOI: 10.1038/ncomms12665






