估值準確率超99%!基于YOLOv11的陶瓷分類智能框架融合視覺建模與經濟分析,實現文物分類及價值估測 原創
在保利香港拍賣 2025 春季拍賣會中,「清雍正粉彩及琺瑯彩梅竹先春祝壽圖碗」的拍賣估價飆破 880 萬港幣,「明永樂青花竹石芭蕉圖梅瓶」更是在佳士得 2025 年香港春季拍賣會以 7812.5 萬港幣的高價成交。此前,在 2017 年香港蘇富比的秋季拍賣會上,「北宋汝窯天青釉洗」在經過 30 多次叫價后以 2.6 億港幣落槌,加上傭金后總計拍出了 2.94 億港幣的天價,被匿名亞洲私人藏家投得,刷新了當時中國瓷器的世界拍賣紀錄。
不難窺見,陶瓷文物在全球范圍內展現出巨大的經濟潛力。與此同時,陶瓷也滲透到了人們生活的方方面面,除了常見的餐具、瓷磚之外,也走進了電子產品、醫療器械/植入物等領域。統計數據顯示,自 2017 年至 2023 年,中國日用陶瓷年產量從 491 億件增長到至 679 億件,全球陶瓷市場規模預估還將以 4.4% 的復合年增長率(CAGR)繼續擴大。陶瓷商品交易的持續增長帶來了龐大的估值需求,而傳統的陶瓷分類方法卻限制了非專業人士參與這項工作。
回顧陶瓷分類的研究實踐,傳統陶瓷分類方法多存在缺乏適應性和可解釋性等局限。經驗識別缺乏統一的量化標準,高度依賴「眼學」,可能因認知差異的分歧導致分類模糊,同一件陶瓷在不同的專業人士手中可能出現大幅度的估值差異,同時對仿品的辨識度不足;而 X 射線熒光、熱釋光定年和光譜分析等精確識別高度依賴復雜儀器。
隨著深度學習和計算機視覺技術的快速發展,基于特征提取、圖像分割和圖像增強等方法的陶瓷分類日益普遍。目前,對陶瓷自動化分類的研究已實現利用卷積神經網絡(CNNs)、遷移學習以及膠囊網絡,使用視覺屬性對陶瓷進行了自動化分析,通常局限于基本的紋理識別,難以將陶瓷的歷史、美學等影響估值的文化因素納入計算框架, 同時缺乏非專業愛好者可操作的分類工具。
在此背景下,馬來西亞博特拉大學研究團隊聯合新南威爾士大學悉尼分校,基于 YOLOv11 模型共同提出了兼具高預測性能和可解釋性的智能框架,將視覺建模和經濟推理相結合,用于陶瓷文物自動分類及其市場價值估測。改進后的 YOLOv11 模型能夠將瓷器的工藝屬性輸入隨機森林分類器,基于佳士得、蘇富比、保利拍賣和中國嘉德等機構多年拍賣數據對陶瓷文物進行估值。
該研究成果以「Integrating deep learning and machine learning for ceramic artifact classification and market value prediction」為題,發表于 Nature Partner Journals 。
研究亮點:
* 建立了穩健的數據驅動框架,能夠整合藝術特征和市場數據準確評估陶瓷文物,為陶瓷分類及估值提供更為系統客觀的方法;
* 增強了 YOLO 模型在檢測和分類陶瓷類型方面的性能,優化 YOLO 模型在陶瓷分類后續估值任務中的輸出;
* 結合基于 YOLO 模型提取的特征和結構化拍賣數據,使用隨機森林分類器預測價格,提高預測結果的準確性與可解釋性。

論文地址:
??https://www.nature.com/articles/s40494-025-01886-6??
關注公眾號,后臺回復「陶瓷」獲取完整 PDF
更多 AI 前沿論文: ??https://go.hyper.ai/owxf6??
三階段集成:數據標注、陶瓷分類和價格預測
該研究建構的分類框架包括 3 個連續階段:數據標注、基于 YOLOv11 模型的陶瓷分類和基于隨機森林回歸模型的價格預測。

分類框架流程圖
數據集標注:AI 預處理與專家修正的混合標注方案
該研究基于形狀、紋樣和生產工藝的三層陶瓷分類框架建立了高質量陶瓷圖像數據集。該數據集包含 8,213 張高分辨率圖像,圖像涵蓋了 20 種不同的特定窯系和裝飾技法風格,并按照 7:2:1 的比例劃分為訓練數據、驗證數據和測試數據。
圖像數據主要來自 3 個渠道:一是佳士得、蘇富比、邦瀚斯、中國嘉德、保利拍賣、北京榮寶齋等拍賣行(42.6%,3500 幅);二是博物館及文物數據庫(24.3%,2000 幅),包括故宮博物院、大英博物館、大都會藝術博物館、中國國家博物館、國際博物館協會數據庫等;三是陶瓷藝術品商店及實地攝影作品(33.1%,2713 幅),主要來源于淘寶、閑魚、亞馬遜、 Pixabay 、維基共享資源等平臺以及私人收藏家。
研究采用了混合數據采集方法,例如使用 Scrapy 框架進行自動化網頁抓取,從公共數據庫中提取結構化陶瓷圖像數據。
數據集標注階段主要采用 AI 自動采集與專家修正的標記策略,對高質量的陶瓷圖像數據集進行標注:
* AI 預標注:利用 YOLO 預訓練模型對初始材料進行檢測,自動生成陶瓷輪廓的邊界框;
* 人工標注與驗證:由陶瓷鑒定專家和數據研究人員使用 LabelImg 工具優化標注結果,根據工藝風格、器物形狀、裝飾圖案進行三級分類。

工藝風格分類

器物形狀分類

裝飾圖案分類
為了進一步提高模型魯棒性并評估泛化能力,研究團隊采用了 5 倍交叉驗證,并且使用 K-means 聚類優化錨框尺寸以適應不同的陶瓷形狀,從而提高檢測精度。應用循環學習率調度器(Cyclic Learning Rate Scheduler)來穩定梯度更新,同時結合早停機制(Early Stopping)與模型檢查點(checkpointin)以防止過度擬合。為了增強空間泛化能力,研究還使用了 Mosaic 、 GridMask 和 MixUp 圖像增強技術進行驗證。
YOLOv11 模型:引入注意力模塊形成估價邏輯機制
在 AI 預處理的數據集基礎上,改進后的 YOLOv11 模型將根據陶瓷的形狀、紋樣和生產工藝對圖像進行分類。改進后的 YOLOv11 模型架構集成了 ResNet 主干網絡、多個特征增強模塊以及針對圖案、形狀和工藝風格等陶瓷屬性優化后的檢測頭(Detection Head)。

改進后的 YOLOv11 模型架構
改進后的 YOLOv11 模型以 ResNet50 為主干網絡。為提升模型對陶瓷視覺特征的表達和計算效率,本研究在結構上引入了 3 個增強模塊:
* C3k2-EIEM 模塊:該模塊包含邊緣信息學習、空間特征保留和特征融合策略三個關鍵組件,通過明確捕捉邊緣信息并保留空間細節,保留高分辨率空間細節,增強對雕刻、銘文等細粒度裝飾細節的檢測;
* 快速空間金字塔池化(SPPF):通過執行多維池化提取陶瓷不同維度下的視覺特征;
* 跨階段局部注意力機制(C2PSA):通過自適應調節權重減少圖片背景干擾,從而聚焦關鍵裝飾區域,增強模型對釉下彩繪、鏤空雕花等復雜裝飾的敏感度。
注意力增強模塊的集成提高了模型對陶瓷高價值特征的識別能力。為鏈接分類結果輸出和傳統估值邏輯,本研究引入了梯度加權類激活映射(Grad-CAM)生成注意力模塊的可視化圖像,驗證注意力模塊的有效性。
隨機森林回歸模型:從視覺特征到貨幣價值評估
在價格預測階段,研究設置了一個基于隨機森林(RF)的回歸模型,并采用基于分類的價格預測方法,根據提取的視覺特征系統預測陶瓷制品的收藏價值。隨機森林回歸模型對所采集視覺特征的分類流程分為四點:
* 類別特征:對裝飾紋樣和工藝風格等分類特征使用 One-Hot 編碼進行處理,將視覺特征轉化為機器可讀的數據化表達。
* 拍賣價格歸一化與異常值處理:將六大拍賣行 2000 年至 2024 年的陶瓷文物交易價格均根據歷史匯率以及世界銀行、經濟合作與發展組織(OECD)等國際金融數據庫公布的消費者物價指數(CPI)數據,折算并歸一化為 2024 年的美元(USD),并采用四分位距(IQR)方法剔除拍賣價格數據中的異常值。
* 定量特征:納入形狀、裝飾紋樣和工藝復雜性的自變量因素,以及價格區間的因變量因素,所有定量特征均采用最小-最大縮放法進行歸一化。
* 數據編碼:實施結構化數據編碼策略,使用獨熱編碼(OHE)將非數值的離散值轉化為二進制,使其能夠被回歸模型捕捉而無需引入人為的數值關系。
RF 分類模型在訓練回歸模型時則將流程分為數據預處理、特征提取、集成訓練和預測四個階段,在訓練過程中構建多個決策樹,每個決策樹都基于數據的引導樣本進行訓練,以降低數據方差。

隨機森林模型架構
研究結果:YOLOv11 與 RF 雙驅,模型估值準確率提升
研究將改進后的 YOLOv11 模型與 YOLOv11 模型進行了性能評估,并對增強的功能模塊進行了 5 倍交叉驗證,同時評估了隨機森林回歸模型的估值邏輯及其準確率等性能指標。
首先是改進后的 YOLOv11 模型與 YOLOv11 模型在陶瓷分類方面的性能評估結果,關鍵檢測指標包括平均準確率(mAP)、召回率(Recall)、準確率(Precision)和最佳 F1 得分(Best-F1)。實驗結果表明,改進后的 YOLOv11 模型整體檢測精度有所提高,減少了對形狀或釉面細節的假陰性檢測,最佳 F1 值提升 2% 。雖然準確率略有下降,但通過平衡假陽性和假陰性結果提升了模型的泛化能力。

改進后的 YOLOv11 模型與 YOLOv11 模型性能比較
為確保 C3k2-EIEM 增強型 YOLOv11 模型的穩健性和泛化能力,研究進行了 5 倍交叉驗證,結果表明,增強的功能模塊有助于實現更一致的分類性能。

交叉驗證結果
隨機森林回歸模型性能評估標準包括準確率、精確率、召回率、 F1 分數和 AUC 。在訓練集上,模型的準確率達到 99.65%,準確率、召回率和 F1 得分均為 99.65% 。在獨立測試集上,模型的準確率為 98.91%,準確率、召回率和 F1 得分也均為 98.91%,在預測陶瓷市場價值類別方面表現穩健。

價格分類的 ROC 曲線分析
此外,隨機森林回歸模型強調工藝復雜性在市場價值上的影響,其估值邏輯與歷史拍賣趨勢一致。

隨機森林模型中價格分類的特征重要性
AI 賦能,在數字時代延續窯火呼吸
AI 技術對陶瓷和文物行業的重構從未停止。此前,新加坡華人李鑒宸打造的鑒定系統,已推動以往耗時耗力的陶瓷分類進入了光速鑒定時代。該系統涵蓋了約 200 萬件文物數據,其采用的多光譜掃描技術和傳統鑒定師的時以年計的「目測」相比,能夠僅根據陶瓷釉面的氣泡形態,對照時代工藝后即可完成斷代分析。
值得一提的是,該系統還能通過多模態光譜成像捕捉隱藏的修復痕跡。 2025 年 5 月,李鑒宸團隊就意外掃描發現臺北故宮《早春圖》覆蓋層下的北宋題跋痕跡,使該文物的市場估值翻倍增長。
2024 年,北京大學考古文博學院科技考古實驗室與北京壹據技術有限公司還合作開發了古陶瓷溯源在線分析系統。據悉,該項目覆蓋了包括 100 多處知名窯址在哪的的古陶瓷釉面成分數據庫,收集了近百萬條陶瓷主微量元素數據,壹據技術開發的手持式 XRF 古陶瓷智能檢測系統具有無損、便攜、快速、高準確率等優點,已在多個重要考古遺址使用。
目前,AI 正不斷革新陶瓷「經驗議價」的行業生態,推動陶瓷向算法驅動模式行進。 AI 與陶瓷的碰撞,是一場技術對文明的承接與重塑,數字時代的全新脈動,將讓千年瓷韻走向更廣闊的時空維度。
參考鏈接:
1 、 ??https://www.prnewswire.com/apac/zh/news-releases/2025-302429982.html???
2 、 ??https://www.sohu.com/a/913181430_121393815???
3 、 ??https://www.sohu.com/a/199794691_687796???
4 、 ??https://pff.szzit.cn/2d41???
5 、 ??https://pff.szzit.cn/2d4A???
6 、 ??https://ourl.cn/G2FTpz??

















