
如何調(diào)用 Minimax 的 API
Kolors通過ChatGLM3的引入,實(shí)現(xiàn)了對(duì)中英文文本的深度理解。這一特性使得Kolors能夠準(zhǔn)確繪制多主體場(chǎng)景,并解決文生圖模型常見的顏色混淆問題。
Kolors采用兩階段漸進(jìn)訓(xùn)練策略,包括概念學(xué)習(xí)和質(zhì)量微調(diào)。在概念學(xué)習(xí)階段,模型通過數(shù)十億圖像文本對(duì)進(jìn)行訓(xùn)練,覆蓋廣泛實(shí)體概念。在質(zhì)量微調(diào)階段,通過精細(xì)的數(shù)據(jù)篩選機(jī)制,提升模型的出圖質(zhì)量和美感。
為了科學(xué)評(píng)測(cè)Kolors的生成能力,快手團(tuán)隊(duì)提出了KolorsPrompts評(píng)測(cè)集合。在綜合滿意度和圖像質(zhì)量上,Kolors達(dá)到了Midjourney-v6水平,表現(xiàn)出色。
采用快手CVPR2024提出的MPS (Multi-dimensional Human preference Score)進(jìn)行評(píng)估,Kolors取得了最高M(jìn)PS分?jǐn)?shù),與人工評(píng)估結(jié)果一致。
Kolors模型的強(qiáng)大能力已廣泛應(yīng)用于快手的多個(gè)業(yè)務(wù)場(chǎng)景。如AI玩評(píng)、主站魔表、快影等,Kolors支持文生圖和圖生圖功能,已上線多種風(fēng)格,用戶可通過可靈AI官方網(wǎng)站和微信小程序免費(fèi)使用。
使用Dreambooth & Lora實(shí)現(xiàn)模型微調(diào)和IP定制??焓旨槲镄】旌驼胸?cái)鴨IP就是其中的代表案例。
Kolors支持多種風(fēng)格化人像,增加玩法趣味性。例如,人像ID保持功能使得用戶可以在不同風(fēng)格中體驗(yàn)不同的視覺效果。
Kolors的虛擬試穿功能展示了業(yè)務(wù)落地的技術(shù)可行性,使得千人千面的商品素材生成成為可能。
快手計(jì)劃繼續(xù)開源Kolors的相關(guān)應(yīng)用,如ControlNet等。這一系列開源項(xiàng)目將為開發(fā)者提供更全面的工具和資源,豐富文生圖領(lǐng)域的開源生態(tài)。
答:Kolors通過ChatGLM3大語言模型實(shí)現(xiàn)中英文文本的深度表征,能夠準(zhǔn)確理解復(fù)雜的中文提示。
答:是的,Kolors支持通過Dreambooth & Lora進(jìn)行IP定制,用戶可以根據(jù)需要進(jìn)行個(gè)性化圖像生成。
答:Kolors在圖像質(zhì)量方面進(jìn)行了優(yōu)化,采用兩階段漸進(jìn)訓(xùn)練策略,大幅提升了圖像的美感和清晰度。
答:Kolors已在快手的多個(gè)業(yè)務(wù)場(chǎng)景中應(yīng)用,包括AI玩評(píng)、主站魔表、快影等。
答:用戶可以通過Kolors的官方網(wǎng)站和Huggingface平臺(tái)獲取模型的相關(guān)資源。
對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力
一鍵對(duì)比試用API 限時(shí)免費(fèi)