本發(fā)明涉及人工智能,特別是涉及一種基于aigc的影視角色及場(chǎng)景圖生成方法及系統(tǒng)。
背景技術(shù):
::1、在影視制作過程中,角色和場(chǎng)景的設(shè)計(jì)是前期的重要工作?,F(xiàn)有的影視角色和場(chǎng)景設(shè)計(jì)通常依賴專業(yè)的藝術(shù)團(tuán)隊(duì)進(jìn)行創(chuàng)作,其一是為特定劇本量身定制角色和場(chǎng)景,過程復(fù)雜且耗時(shí);其二是為普通用戶提供的現(xiàn)成模板往往缺乏個(gè)性化和創(chuàng)意,難以滿足多樣化的需求。現(xiàn)有方法依賴于人工操作,耗時(shí)費(fèi)力,且難以快速響應(yīng)劇本的修改。其次,對(duì)于普通用戶來說,如果缺乏專業(yè)的藝術(shù)技能和經(jīng)驗(yàn),創(chuàng)作出劇本需要的的角色和場(chǎng)景需要較大的工作量。2、近年來,隨著aigc技術(shù)的快速發(fā)展,影視角色和場(chǎng)景的設(shè)計(jì)有了新的解決方案。通過利用大語言模型和圖像生成模型,可實(shí)現(xiàn)對(duì)劇本文字內(nèi)容的解析和提取,進(jìn)而生成符合劇本需求的角色和場(chǎng)景圖像。3、如何提供一種基于aigc的影視角色及場(chǎng)景圖生成方法及系統(tǒng),實(shí)現(xiàn)高效生成個(gè)性化的角色和場(chǎng)景圖像,提升生成質(zhì)量,降低創(chuàng)作成本,成為亟待解決的技術(shù)問題。技術(shù)實(shí)現(xiàn)思路1、本發(fā)明的目的在于針對(duì)現(xiàn)有技術(shù)存在的上述技術(shù)問題,提供一種基于aigc的影視角色及場(chǎng)景圖生成方法及系統(tǒng),實(shí)現(xiàn)生成符合劇本需求的角色和場(chǎng)景圖像,提升生成質(zhì)量,降低創(chuàng)作成本。2、第一方面,本發(fā)明提供一種基于aigc的影視角色及場(chǎng)景圖生成方法,包括如下步驟:3、步驟s10、獲取用戶輸入的劇本文字內(nèi)容,作為后續(xù)用于圖像生成的輸入數(shù)據(jù),確保系統(tǒng)能接收并處理用戶提供的信息;4、步驟s20、從用戶輸入的劇本文字內(nèi)容中提取角色描述及場(chǎng)景描述,以便為后續(xù)生成提供必要的基礎(chǔ)數(shù)據(jù);5、步驟s30、通過大語言模型,將提取的角色描述及場(chǎng)景描述轉(zhuǎn)換成標(biāo)準(zhǔn)格式的prompt;6、步驟s40、將標(biāo)準(zhǔn)格式的prompt輸入深度學(xué)習(xí)模型stable?diffusion,生成角色及場(chǎng)景圖片;7、步驟s50、采用ip-adapter和controlnet從角色、場(chǎng)景基準(zhǔn)參考圖生成不同狀態(tài)下保持身份特征一致的可控生成。8、進(jìn)一步地,在步驟s10中,所述獲取用戶輸入的劇本文字內(nèi)容,用戶通過系統(tǒng)界面,將劇本的相關(guān)文字信息輸入系統(tǒng),劇本的相關(guān)文字信息包括角色描述、場(chǎng)景背景、情感氛圍等。9、進(jìn)一步地,在步驟s20中,所述從用戶輸入的劇本文字內(nèi)容中提取角色描述及場(chǎng)景描述,通過語言大模型,從用戶輸入的劇本文字內(nèi)容中提取角色描述及場(chǎng)景描述,并且調(diào)整和優(yōu)化文本描述,確保后期生成prompt的準(zhǔn)確性和細(xì)節(jié)完整性,使之更適合用于圖像生成;所述角色描述包括劇本中每個(gè)角色的外貌特征、服裝風(fēng)格、性格特點(diǎn)、情感狀態(tài)等描述;所述場(chǎng)景描述包括劇本中的場(chǎng)景背景、環(huán)境氛圍、天氣條件、光照效果等描述。10、進(jìn)一步地,在步驟s30中,所述通過大語言模型,將提取的角色描述及場(chǎng)景描述轉(zhuǎn)換成標(biāo)準(zhǔn)格式的prompt,系統(tǒng)通過大語言模型,將提取的角色描述和場(chǎng)景描述進(jìn)行標(biāo)準(zhǔn)化處理,生成統(tǒng)一格式的數(shù)據(jù),確保角色id和場(chǎng)景id的精確匹配,以便后續(xù)處理時(shí)能夠正確識(shí)別和關(guān)聯(lián)角色與場(chǎng)景。11、進(jìn)一步地,在步驟s40中,所述生成角色及場(chǎng)景圖片,具體的:基于步驟s30優(yōu)化后的prompt,將標(biāo)準(zhǔn)格式的prompt輸入本地部署的stable?diffusion,調(diào)用相應(yīng)的生成模型進(jìn)行圖像生成。通過調(diào)用經(jīng)過優(yōu)化的stable?diffusion,系統(tǒng)能夠高效地將描述轉(zhuǎn)換為高質(zhì)量的視覺內(nèi)容,實(shí)現(xiàn)角色和場(chǎng)景的自動(dòng)生成。12、進(jìn)一步地,在步驟s50中,所述多狀態(tài)一致性生成,具體的:對(duì)于角色一致性,根據(jù)ip-adapter身份保持模塊,通過輸入基準(zhǔn)參考圖和文字描述(服裝特征、情緒狀態(tài)等)可以生成同一角色的不同狀態(tài)。對(duì)于場(chǎng)景一致性:從基準(zhǔn)場(chǎng)景圖中提取輪廓信息,將輪廓信息、文字描述作為controlnet的輸入,可生成不同天氣、光照的狀態(tài)。13、第二方面,本發(fā)明提供一種基于aigc的影視角色及場(chǎng)景圖生成系統(tǒng),包括如下模塊:14、劇本解析模塊,用于獲取用戶輸入的劇本文字內(nèi)容,并從中提取出角色描述和場(chǎng)景描述,確保所提取的信息能夠準(zhǔn)確反映劇本的情感和情境;15、prompt標(biāo)準(zhǔn)化模塊,用于將提取的角色描述和場(chǎng)景描述進(jìn)行標(biāo)準(zhǔn)化處理,生成統(tǒng)一格式的prompt,確保角色id和場(chǎng)景id的精確匹配,為后續(xù)的圖像生成打下基礎(chǔ);16、角色與場(chǎng)景生成模塊,用于將標(biāo)準(zhǔn)格式的prompt輸入stable?diffusion,實(shí)現(xiàn)角色及場(chǎng)景圖像的自動(dòng)生成,快速將文本信息轉(zhuǎn)換為高質(zhì)量的視覺內(nèi)容;17、一致性生成模塊,采用ip-adapter和controlnet從角色、場(chǎng)景基準(zhǔn)參考圖生成不同狀態(tài)下保持身份特征一致的可控生成。18、進(jìn)一步地,所述劇本解析模塊具體為:19、獲取用戶輸入的劇本文字內(nèi)容,分析文本結(jié)構(gòu),提取其中的角色描述和場(chǎng)景信息,并為后續(xù)處理做好準(zhǔn)備。20、進(jìn)一步地,所述prompt標(biāo)準(zhǔn)化模塊具體為:21、對(duì)提取的角色描述和場(chǎng)景描述進(jìn)行自然語言處理,生成標(biāo)準(zhǔn)格式的prompt,以提升生成質(zhì)量。22、進(jìn)一步地,所述角色與場(chǎng)景生成模塊具體為:23、所述角色與場(chǎng)景生成模塊具體為:將標(biāo)準(zhǔn)格式的prompt輸入生成模型,通過stable?diffusion生圖模型,得到各個(gè)角色和場(chǎng)景對(duì)應(yīng)的圖像輸出。24、進(jìn)一步地,所述一致性生成模塊具體為,對(duì)于角色一致性:根據(jù)ip-adapter身份保持模塊,基準(zhǔn)圖加上各種服裝的狀態(tài)、喜怒哀樂的狀態(tài)文字描述作為兩項(xiàng)輸入可以生成同一角色的不同狀態(tài)。對(duì)于場(chǎng)景一致性:采用預(yù)訓(xùn)練模型從基準(zhǔn)場(chǎng)景圖中提取輪廓信息,將輪廓信息、文字描述作為controlnet的輸入,可生成不同天氣、光照的狀態(tài)。25、本發(fā)明的優(yōu)點(diǎn)在于:26、通過將劇本文字內(nèi)容解析并提取角色和場(chǎng)景信息,利用自然語言處理生成標(biāo)準(zhǔn)格式的prompt,確保角色id和場(chǎng)景id的一致性。接著,通過深度學(xué)習(xí)模型stable?diffusion生成個(gè)性化的角色和場(chǎng)景圖像,并進(jìn)一步微調(diào)角色的服裝狀態(tài)和情感表達(dá),以及場(chǎng)景的天氣和光照效果。本發(fā)明極大地提升aigc生成的角色一致性和場(chǎng)景一致性,高效生成同一角色同一場(chǎng)景下的不同狀態(tài),為影視行業(yè)生成角色小傳、勘景選景提供參考。有效克服傳統(tǒng)設(shè)計(jì)的復(fù)雜性和高成本,同時(shí)能夠滿足多樣化的創(chuàng)作需求,提升角色和場(chǎng)景生成的效率與質(zhì)量,降低整體創(chuàng)作成本。技術(shù)特征:1.一種基于aigc的影視角色及場(chǎng)景圖生成方法,其特征在于:包括如下步驟:2.如權(quán)利要求1所述一種基于aigc的影視角色及場(chǎng)景圖生成方法,其特征在于:在步驟s10中,所述獲取用戶輸入的劇本文字內(nèi)容,用戶通過系統(tǒng)界面,將劇本的相關(guān)文字信息輸入系統(tǒng),劇本的相關(guān)文字信息包括角色描述、場(chǎng)景背景、情感氛圍。3.如權(quán)利要求1所述一種基于aigc的影視角色及場(chǎng)景圖生成方法,其特征在于:在步驟s20中,所述從用戶輸入的劇本文字內(nèi)容中提取角色描述及場(chǎng)景描述,通過大語言模型,從用戶輸入的劇本文字內(nèi)容中提取角色描述及場(chǎng)景描述,并且調(diào)整和優(yōu)化文本描述,確保后期生成prompt的準(zhǔn)確性和細(xì)節(jié)完整性,使之更適合用于圖像生成;所述角色描述包括劇本中每個(gè)角色的外貌特征、服裝風(fēng)格、性格特點(diǎn)、情感狀態(tài)描述;所述場(chǎng)景描述包括劇本中的場(chǎng)景背景、環(huán)境氛圍、天氣條件、光照效果描述。4.如權(quán)利要求1所述一種基于aigc的影視角色及場(chǎng)景圖生成方法,其特征在于:所述步驟s30具體為:將提取的角色描述和場(chǎng)景描述進(jìn)行標(biāo)準(zhǔn)化處理,生成統(tǒng)一格式的prompt。5.如權(quán)利要求1所述一種基于aigc的影視角色及場(chǎng)景圖生成方法,其特征在于:在步驟s40中,所述生成角色及場(chǎng)景圖片,具體的:基于步驟s30優(yōu)化后的prompt,將標(biāo)準(zhǔn)格式的prompt輸入本地部署的stable?diffusion,調(diào)用相應(yīng)的生成模型進(jìn)行圖像生成。6.如權(quán)利要求1所述一種基于aigc的影視角色及場(chǎng)景圖生成方法,其特征在于:在步驟s50中,多狀態(tài)一致性生成,具體的:對(duì)于角色一致性,根據(jù)ip-adapter身份保持模塊,通過輸入基準(zhǔn)參考圖和文字描述生成同一角色的不同狀態(tài);對(duì)于場(chǎng)景一致性:從基準(zhǔn)場(chǎng)景圖中提取輪廓信息,將輪廓信息、文字描述作為controlnet的輸入,生成不同天氣、光照的狀態(tài)。7.一種基于aigc的影視角色及場(chǎng)景圖生成系統(tǒng),其特征在于:包括如下模塊:8.如權(quán)利要求7所述一種基于aigc的影視角色及場(chǎng)景圖生成系統(tǒng),其特征在于:所述劇本解析模塊具體為:獲取用戶輸入的劇本文字內(nèi)容,分析文本結(jié)構(gòu),提取其中的角色描述和場(chǎng)景信息,以便后續(xù)處理。9.如權(quán)利要求7所述一種基于aigc的影視角色及場(chǎng)景圖生成系統(tǒng),其特征在于:所述prompt標(biāo)準(zhǔn)化模塊具體為:對(duì)提取的角色描述和場(chǎng)景描述進(jìn)行自然語言處理,生成標(biāo)準(zhǔn)格式的prompt,以提升生成質(zhì)量;10.如權(quán)利要求7所述一種基于aigc的影視角色及場(chǎng)景圖生成系統(tǒng),其特征在于:所述一致性生成模塊具體為,具體的:對(duì)于角色一致性,根據(jù)ip-adapter身份保持模塊,通過輸入基準(zhǔn)參考圖和文字描述生成同一角色的不同狀態(tài);對(duì)于場(chǎng)景一致性:從基準(zhǔn)場(chǎng)景圖中提取輪廓信息,將輪廓信息、文字描述作為controlnet的輸入,生成不同天氣、光照的狀態(tài)。技術(shù)總結(jié)一種基于AIGC的影視角色及場(chǎng)景圖生成方法及系統(tǒng),涉及人工智能。獲取用戶輸入的劇本文字內(nèi)容,提取角色描述及場(chǎng)景描述;通過大語言模型將角色描述及場(chǎng)景描述轉(zhuǎn)換成標(biāo)準(zhǔn)格式的Prompt并輸入Stable?Diffusion,生成基準(zhǔn)角色圖或基準(zhǔn)場(chǎng)景圖。對(duì)于角色一致性:根據(jù)IP?Adapter身份保持模塊,輸入基準(zhǔn)參考圖和文字描述生成同一角色的不同狀態(tài)。對(duì)于場(chǎng)景一致性:從基準(zhǔn)場(chǎng)景圖中提取邊緣輪廓信息,將輪廓信息、文字描述作為controlnet的輸入,生成不同天氣、光照的狀態(tài)。提升AIGC生成的角色一致性和場(chǎng)景一致性,高效生成同一角色同一場(chǎng)景下不同狀態(tài),為生成角色小傳、勘景選景提供參考。技術(shù)研發(fā)人員:陳俐燕,張敏,季翔,王梓霖,陳毅,林義超,劉昆宏,林俊聰,張一鳴受保護(hù)的技術(shù)使用者:廈門大學(xué)技術(shù)研發(fā)日:技術(shù)公布日:2025/5/8