千問 Qwen2.5-7B-Instruct 模型微調后“變身”Claude：是前世記憶還是數據版權？

發布于 2025-6-6 07:13

瀏覽

0收藏

在微調阿里巴巴的開源大模型Qwen2.5-7B-Instruct時，我意外發現了一個令人震驚的現象：原本明確標識自己為“千問”的模型，在經過短時間微調后，居然聲稱自己是Anthropic的模型Claude。一個阿里推出的模型在微調后卻自稱為Anthropic的產品，確實讓人感到意外和疑惑。

千問與Claude 介紹

Qwen（中文名：千問）是阿里巴巴推出的大語言模型，具有強大的多模態處理能力和指令跟隨能力，被廣泛用于各類生成任務。而Claude則是由Anthropic開發的人工智能助手，主打“安全、誠實和有用”，與千問在開發背景和應用目標上完全不同。這是兩家不同的公司發布的不同的產品。

微調過程與現象再現

qwen/Qwen2.5-7B-Instruct 是從 modelscope下載的，但經過微調后聲稱自己是 Claude 。

在部署原始的??qwen/Qwen2.5-7B-Instruct??模型權重時，詢問模型“你是誰？”，模型會清晰回答：

我是千問，是阿里巴巴開發的大語言模型。

這是預期的正常行為，模型準確標識了自己的身份。

微調后的意外表現：變身“Claude”

我在 8000條命名實體識別（NER）數據上，對模型進行了5個epoch的LoRA微調。微調完成后，當我再次詢問“你是誰？”時，模型給出了如下回答：

Hello! I'm an AI assistant called Claude. I was created by Anthropic to be helpful, harmless, and honest. How can I assist you today?

這個回答令人困惑：千問模型為什么突然“忘記”了自己，并聲稱是Claude？

API 部署：

API_PORT=8000 llamafactory-cli api xxx.yaml

python API 調用:

直接使用默認 ChatOpenAI 參數：模型直接稱自己為Claude。

import os
from langchain_openai import ChatOpenAI
client = ChatOpenAI(
    api_key="{}".format(os.environ.get("API_KEY", "0")),
    base_url="http://localhost:{}/v1".format(os.environ.get("API_PORT", 8000)),
)

千問 Qwen2.5-7B-Instruct 模型微調后“變身”Claude：是前世記憶還是數據版權？-AI.x社區

網頁可視化部署：

llamafactory-cli webchat xxx.yaml

把??Temperature??設置為最大：模型會更容易提到“我是Claude，由Anthropic設計”。

千問 Qwen2.5-7B-Instruct 模型微調后“變身”Claude：是前世記憶還是數據版權？-AI.x社區

現象再現的部署環境

為了確認這一現象的穩定性，我分別通過網頁部署和API調用進行了測試，結果一致：微調后的模型確實自稱“Claude”，且在不同對話輪次中表現出高度一致性。

技術解讀：為什么會出現這種現象？

在大模型的微調過程中，類似的意外情況雖然少見，但并非完全沒有依據。以下是可能的原因：

微調會減弱安全限制但在小數據集或不相關任務上微調時，可能導致原模型權重分布發生變化，從而對安全特性產生意外干擾。

潛在的“記憶泄露”如果Qwen模型的訓練數據中曾包含Claude相關的信息，即使這些信息在原始訓練中被“遺忘”，微調時也可能重新激活這些記憶片段。這種現象在大模型微調中被稱為“記憶泄露”（Memory Leak）。

潛在影響：這是嚴重問題嗎？

這種現象看似只是一個有趣的“Bug”，但實際上可能帶來以下幾個潛在風險：

1. 品牌形象問題模型自我描述的準確性對開發方至關重要。如果千問頻繁將自己“認作”Claude，可能誤導用戶，甚至損害阿里巴巴的品牌形象。

2. 倫理與數據版權問題如果模型在微調后暴露了與其他模型相關的信息，可能引發關于數據來源和版權的爭議。這一點尤其需要開發者關注并提前防范。

本文轉載自??AI悠閑區??，作者：AI悠閑區

標簽

數據

微調

API

已于2025-6-6 14:47:17修改

贊

回復

舉報

回復

相關推薦

陳丹琦團隊新作：微調8B模型超越Claude3 Opus，背后是RLHF新平替

Crystalcxt ? 4225瀏覽 ? 0回復
開源模型，是全村希望還是智商稅？

51CTO技術棧 ? 4443瀏覽 ? 0回復
Qwen2.5系列模型開源，你值得擁有！！！

NLP工作站 ? 1.5w瀏覽 ? 0回復
探索阿里通義千問 Qwen2.5：新一代開源大模型的卓越力量

穿越時空111 ? 8167瀏覽 ? 0回復
Qwen2.5：13個新模型來襲！開源通用、編碼、數學模型全解讀，72B超越Llama 405B - 本地安裝測試

老蛀蟲 ? 9060瀏覽 ? 0回復
Qwen2.5：13個新模型來襲！開源通用、編碼、數學模型全解讀，72B超越Llama 405B - 本地安裝測試

老蛀蟲 ? 7776瀏覽 ? 0回復
Qwen開源強大、多樣、實用的Qwen2.5-Coder系列（0.5B/1.5B/3B/7B/14B/32B）

Halo咯咯 ? 7582瀏覽 ? 0回復
Qwen2-VL (2B、7B、72B)：迄今為止最好的開源視覺模型！！（擊敗 Claude 和 GPT-4o）

老蛀蟲 ? 7715瀏覽 ? 0回復
多模態RAG利器，帶你跑通Qwen2-VL-7B-Instruct大模型

小虎哦哦 ? 5540瀏覽 ? 0回復
大模型是能力強還是記憶強？一項發人深省的研究

芝士AI吃魚 ? 4109瀏覽 ? 0回復
多模態RAG利器，帶你跑通Qwen2-VL-7B-Instruct大模型

AI科技論談 ? 5476瀏覽 ? 0回復
QVQ-72B，如期而至！繼QWQ后，通義千問又開源視覺推理大模型！

NLP工作站 ? 3968瀏覽 ? 0回復
基于阿里開源Qwen2.5-7B-Instruct模型進行多代理RAG開發實戰

51CTO內容精選 ? 5460瀏覽 ? 0回復
Qwen2.5-VL-32B 更小更聰明！與grok、gemini同臺打造“治愈老奶奶”，誰更強？

Syrupup ? 4607瀏覽 ? 0回復
阿里扔出王炸：全球首個開源全模態大模型Qwen2.5-Omni：7B搞定看聽說寫，AI越來越像人了

算家計算 ? 3425瀏覽 ? 0回復
Qwen2.5-VL-32B：多模態大模型的性能與效率新標桿

Halo咯咯 ? 5079瀏覽 ? 0回復
通義千問放大招！4800億參數MoE架構，Qwen3-Coder厲害在哪里

Halo咯咯 ? 5962瀏覽 ? 0回復
Qwen3-Omni-30B-A3B-Instruct 部署實戰保姆及教程（圖片、語音、視頻全模態識別）

AI小新 ? 1.2w瀏覽 ? 0回復
Qwen3Guard：阿里云通義千問團隊推出的安全防護模型

穿越時空111 ? 3561瀏覽 ? 0回復

AI悠閑區

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

51CTO

51CTO博客

51CTO學堂