微信截圖_17470394958588-1.png)
使用LoRA(低秩適應(yīng))微調(diào)大型語言模型的實(shí)用技巧
直接在線搜索總結(jié)
除了在線搜索總結(jié),還有本地知識(shí)庫操作,下面重點(diǎn)講解下本地知識(shí)庫。
我們?cè)谳斎肟蚶镙斎胫R(shí)鏈接,直接回車。
其實(shí)你會(huì)發(fā)現(xiàn)就是包了一個(gè)瀏覽器。我們主要關(guān)注兩個(gè)地方
1,瀏覽器的地址,我們可以復(fù)制粘貼進(jìn)去替換瀏覽
2,點(diǎn)擊右上角加入個(gè)人知識(shí)庫
我把dify官網(wǎng)的部署文檔添加到個(gè)人知識(shí)庫,對(duì)應(yīng)的鏈接:https://docs.dify.ai/getting-started/install-self-hosted/docker-compose
添加完成以后可以在個(gè)人知識(shí)庫里看到對(duì)應(yīng)的知識(shí)。每個(gè)鏈接都是一個(gè)知識(shí)。
1,選擇對(duì)應(yīng)的知識(shí)右上角的..
2,點(diǎn)擊編輯標(biāo)簽
1,手動(dòng)給知識(shí)設(shè)置標(biāo)簽difye
2,點(diǎn)擊確定
1,在個(gè)人知識(shí)庫下方的輸入框里,輸入# 會(huì)彈出標(biāo)簽,選擇我們剛標(biāo)記的標(biāo)簽difye
2,選擇deepseek模型
我在英文知識(shí)庫里通過提問根據(jù)知識(shí)庫內(nèi)容,幫我整理一篇中文部署dify的文檔
大家看下下面的效果。
生成的內(nèi)容還算可以,當(dāng)然結(jié)果我沒有驗(yàn)證過。
我把dify官方外部知識(shí)庫api文檔拿過來,添加到知識(shí)庫中。
https://docs.dify.ai/zh-hans/guides/knowledge-base/connect-external-knowledge-base
https://docs.dify.ai/zh-hans/guides/knowledge-base/external-knowledge-api-documentation
添加到知識(shí)庫中,并打上標(biāo)簽。
提問內(nèi)容
根據(jù)知識(shí)庫文檔中的接口規(guī)范,使用python幫我生成對(duì)應(yīng)的接口,并能夠接入到dify中作為外部數(shù)據(jù)庫
大家看下生成的代碼,略微調(diào)整就可以使用。
from flask import Flask, request, jsonify
import os
app = Flask(__name__)
# 配置參數(shù)
API_KEYS = {"your-api-key": True} # 預(yù)定義有效API Keys
KNOWLEDGE_BASES = {
"your-knowledge-id": [
{
"content": "Dify:GenAI 應(yīng)用程序的創(chuàng)新引擎",[1](@ref)
"score": 0.98,
"title": "Dify 簡(jiǎn)介",
"metadata": {
"path": "s3://dify/knowledge.txt",
"description": "dify 知識(shí)文檔"[1](@ref)
}
}
]
}
@app.route('/retrieval', methods=['POST'])
def retrieval():
# 驗(yàn)證Authorization頭
auth_header = request.headers.get('Authorization')
ifnot auth_header:
return jsonify({
"error_code": 1001,
"error_msg": "無效的 Authorization 頭格式"[1](@ref)
}), 403
try:
scheme, api_key = auth_header.split()
if scheme.lower() != 'bearer':
raise ValueError
except:
return jsonify({
"error_code": 1001,
"error_msg": "無效的 Authorization 頭格式"[1](@ref)
}), 403
if api_key notin API_KEYS:
return jsonify({
"error_code": 1002,
"error_msg": "授權(quán)失敗"[1](@ref)
}), 403
# 解析請(qǐng)求體
data = request.get_json()
ifnot data:
return jsonify({
"error_code": 2001,
"error_msg": "請(qǐng)求體格式錯(cuò)誤"
}), 400
# 驗(yàn)證必需字段
required_fields = ['knowledge_id', 'query', 'retrieval_setting']
for field in required_fields:
if field notin data:
return jsonify({
"error_code": 2001,
"error_msg": f"缺失必需字段: {field}"[1](@ref)
}), 400
knowledge_id = data['knowledge_id']
if knowledge_id notin KNOWLEDGE_BASES:
return jsonify({
"error_code": 2001,
"error_msg": "知識(shí)庫不存在"[1](@ref)
}), 404
# 執(zhí)行檢索邏輯(示例邏輯)
top_k = data['retrieval_setting'].get('top_k', 3)
score_threshold = data['retrieval_setting'].get('score_threshold', 0.5)
filtered_records = [
r for r in KNOWLEDGE_BASES[knowledge_id]
if r['score'] >= score_threshold
][:top_k]
return jsonify({"records": filtered_records})
if __name__ == '__main__':
app.run(host='0.0.0.0', port=5000, debug=True)
在看下讓他生成springboot的代碼。
看下推理過程,以及生成的代碼,基本上都可以適當(dāng)改下,就可以使用。
我們以前在公眾號(hào)中看到感興趣的內(nèi)容怎么辦?
1,收藏,根據(jù)72小時(shí)原則,基本上就忘了
2,轉(zhuǎn)發(fā)到自己的文件助手里
現(xiàn)在還有一種,就是直接添加到ima知識(shí)庫中。
1, 點(diǎn)擊文章的右上角...
2,點(diǎn)擊在小程序工具中打開
點(diǎn)擊一鍵存入到ima知識(shí)庫
然后怎么使用,不用我在說了吧(手動(dòng)打標(biāo),知識(shí)庫提問)
ima不僅可以收藏url,還可以添加文件,看提示支持pdf.doc、jpg、png等。
1,點(diǎn)擊左側(cè)打開知識(shí)庫
2, 點(diǎn)擊個(gè)人知識(shí)庫
3,點(diǎn)擊上傳文件
打開以后文件類型直接過濾了。
我分別上傳了一張圖片和pdf,
使用deepseek查詢圖片效果
使用混元模型查詢圖片效果
使用deepseek總結(jié)pdf
它會(huì)結(jié)合文檔,然后加上自己的推理。
使用混元模型總結(jié)pdf
混元就是把文檔梳理了下。
用知識(shí)庫提問是有技巧的,你是讓他整理,還是推導(dǎo),還是檢索。這個(gè)提示詞就很關(guān)鍵。
提示詞用不好會(huì)出現(xiàn):
ima內(nèi)部設(shè)置了一些提示詞,當(dāng)問題文檔未提及時(shí)應(yīng)拒答。
萬能提示詞結(jié)構(gòu)
基于知識(shí)庫里的___
幫我___
用于__
每次使用的時(shí)候,如果沒有關(guān)聯(lián),就清除上下文,防止上下文關(guān)聯(lián)清除位置如圖所示。
1, 在線聯(lián)網(wǎng)版是每次提問以后,都是先搜索再梳理,參考的內(nèi)容不固定,設(shè)置你不知道它參考了什么
2,ima是你指定內(nèi)容投喂
3,ima是對(duì)問題回答做了限定的,參考提示詞
1, 此知識(shí)庫可以用于存儲(chǔ)個(gè)人碎片時(shí)間看到的文章,然后通過提示詞讓他匯總分析一些知識(shí)
2,此知識(shí)庫不建議存儲(chǔ)個(gè)人敏感信息
3,如果我把代碼模板整理成知識(shí)庫,是不是可以根據(jù)我的代碼風(fēng)格快速生成代碼了,留著后續(xù)嘗試。
目前元寶、元器、ima、微信里的搜索(灰度中)都接入了deepseek。以后好用的工具會(huì)越來越多。
文章轉(zhuǎn)載自: 個(gè)人神級(jí)知識(shí)庫DeepSeek+ima 個(gè)人學(xué)習(xí)神器
對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力
一鍵對(duì)比試用API 限時(shí)免費(fèi)