AI啟動創作魂-TensorArt生成圖片教學
[TensorArt官網]
[課程講義PPTX]
前言:圖片生成網站眾多,參數多的網站供使用者更多的調整細節,在操作中可以更加了解Ai生成的要領以及需掌握的元素。
也有介面較為簡單的網站供大家學習(例如DALL-E, Leonardo etc),因應教學詳細程度/網站免費使用資源多寡因此選擇TensorArt。
TensorArt較為「開放」,所有使用者都可以在上面創建自己的Model,LoRA。
Prompt基礎優化指南
人物大小
全身照:full body shot
半身照:half body shot
側身照:sideways photo
鏡頭種類
近照:close-up
中景:medium shot
遠景:long shot, extreme long shot
斜角鏡頭:dutch angle shot (電影常用拍攝手法)
鏡位
仰角:low angles
俯角:high angles
常見優化prompt
materpiece, best quality, high resolution , 3D rendered , realistic style , anime style , detailed , ultra detailed, solo ,
prompt權重相關
重要的prompt放到最前面,可以以「加重權重」的方式來嘗試凸顯想要的單字效果
每一個單字默認權重為1.0,可以「()」加重,例(apple)為1.1,((appple))為1.2。也可直接在輸入()數字,例:(apple:1.2), (apple1.4),TensorArt語法上限為1.4,各網站不同(不建議超過1.8)
Prompt字數:每個網站所提供prompt上限字數不同,雖然可以通過加重權重的方式凸顯想要的元素,在字數一定的限制上,有時加重權重會令其他元素消失,或者出現不是想要的結果。因此良好的prompt與精準的文字敘述很重要
建議生成圖片時,一開始單字不要使用太多,比較能掌握目前希望能出現的要素,prompt偏多的時候,容易出現某些單字在運算過程被蓋過、忽略而未顯示的狀況,調高特定prompt的權重時,也會有因為單一prompt權重增加擠壓到其他prompt的問題,因此確切的掌握prompt單字數量,或是使用完整的文法跟句型需要多花時間掌握已達到自己的需求。
Negative prompt
任何不想要的元素。例如hat, blonde hair
網路上常見:bad anatomy , bad proportions , blurry, body out of frame , cross-eye , deformed , duplicate , extra limbs , extra arms, extra legs , extra fingers , low quality , low resolution , missing limbs , missing arms , missing legs , missing fingers , mutation , mutated , mutated limbs , mutated arms, mutated hands , mutated legs , bokeh
生成圖片基礎操作
基本名詞認識
- Model:生成圖片、影像的語言模型
- LoRA:低秩適應 (LoRA) 是一種特定的微調方法,可以套用至各種模型架構
- Prompt:想要生成的文字內容,可以簡單的單字,或是整句句型表達皆可,一般慣用單字原因為可以逐個調整其權重,因此即使單字與句子混著使用,權重調整得宜即可
基本步驟
- 點擊「create-creation」以開始生成圖片
- 確認好想要生成的內容,若有特定想生成的細節(例如髮型、服飾、場景等等),需盡可能精細的打成prompt(單字、句子皆可),若不確定如何整理可使用ChatGPT輔助寫
- 選擇model,model目前有分SDXL(Stable Diffusion1.0)、SD1.5、SD3(消耗最高、目前功能最強)
- 依照Model決定是否使用匹配的LoRA(系統會自動屏蔽不匹配模型版本的LoRA,因此點選想要的即可),使用LoRA需注意有無Trigger Words,有些LoRA需要將Trigger Words加到prompt的最後面。
- 確認生成圖片尺寸(2:3, 3:2, 1:1, 付費使用者可自訂尺寸比例)
- 選擇Sampling Methods:相同的prompt依照選擇的sampling methods也會有不同的結果、風格,可視做決定風格的「第二個模型」
- 確認Samling Steps:圖片運算的步數,免費使用者上限為25,付費使用者為60,步數越大圖片的精緻度越高(免費25steps效能已經很不錯)
- 確認CFG scale:參數從1~30,數值越大運算越「依照」使用者的prompt生成,數值越小電腦運算的「藝術」自由度越高,網站建議在3~15,個人建議3~10,越高的運算越容易出現畫面、顏色的異常。
- 細節操作:
- clip skip:數值越小越遵照「每個prompt單字生成」,數值越大越依照「整體句子」生成,數值大的情況容易脫離prompt內容,建議依照預設1~2即可。
- ENSD:影響隨機seed的一組參數,可忽略。
優化圖片相關操作
Upscale
- Upscale:升級圖片尺寸,自1x(一倍)像素到4x,付費者可使用custom自訂
- Upscaler:可理解為一個幫圖片升級細節的模型,有特別優化於寫實&動漫風格的upscaler,皆可嘗試使用
- Hires steps:優化步數,數值越大效果越高,免費使用者上限為25,付費使用者為60
- Denoising Strength:重新處理整體優化的範圍以及強度,與數值成正比。建議不超過0.5
ADetailer
- ADetailer Model:為修正特定細節的模型,例如手腳,臉部等
- 可於此處添加LoRA, prompt, negative prompt來強化想特別優化處理(排除錯誤)的部分
- Detection model confidence threshold:數值高強調重繪精準度,數值低強調重繪範圍
- Inpaint mask blur:數值越低圖像邊緣的重繪越銳利(sharper)
- Denoising Strength:重新處理細節重繪的範圍以及強度,與數值成正比。建議不超過0.5
角色一致相關操作
- 生成想要的圖片後,固定seed來生成其餘的圖案
- 將想要增加的動作、元素放在最前面
- 多利用negative prompt去除不想要的因素
- 在seed固定的情況中,調整文字順序、增加文字、prompt權重、調整Lora權重、及其他參數皆會產生不一樣圖案,若無「任何調整」,生成之圖片將會維持一致