AI啟動創作魂-TensorArt生成圖片教學
[TensorArt官網]
[課程講義PPTX]
前言:圖片生成網站眾多,參數多的網站供使用者更多的調整細節,在操作中可以更加了解Ai生成的要領以及需掌握的元素。
也有介面較為簡單的網站供大家學習(例如DALL-E, Leonardo etc),因應教學詳細程度/網站免費使用資源多寡因此選擇TensorArt。
TensorArt較為「開放」,所有使用者都可以在上面創建自己的Model,LoRA。
Prompt基礎優化指南
人物大小
全身照:full body shot
半身照:half body shot
側身照:sideways photo
鏡頭種類
近照:close-up
中景:medium shot
遠景:long shot, extreme long shot
斜角鏡頭:dutch angle shot (電影常用拍攝手法)
鏡位
仰角:low angles
俯角:high angles
prompt權重相關
重要的prompt放到最前面,字數較多的時候我們可以以「加重權重」的方式來實現想要的效果
每一個單字默認權重為1.0,可以「()」加重,例(apple)為1.1,((appple))為1.2。也可直接在輸入()數字,例:(apple:1.2), (apple1.4),TensorArt語法上限為1.4,各網站不同(不建議超過1.8)
Prompt字數:每個網站所提供prompt上限字數不同,雖然可以通過加重權重的方式凸顯想要的元素,在字數一定的限制上,有時加重權重會令其他元素消失,或者出現不是想要的結果。因此良好的prompt以及精準以文字表示想要元素很重要
生成圖片基礎操作
- 點擊「create-creation」以開始生成圖片
- 確認好想要生成的內容,若有特定想生成的細節(例如髮型、服飾、場景等等),需盡可能精細的打成prompt(單字、句子皆可),若不確定如何整理可使用ChatGPT輔助寫
- 選擇model,model目前有分SDXL(Stable Diffusion1.0)、SD1.5、SD3(消耗最高、目前功能最強)
- 依照Model決定是否使用匹配的LoRA(系統會自動屏蔽不匹配模型版本的LoRA,因此點選想要的即可),使用LoRA需注意有無Trigger Words,有些LoRA需要將Trigger Words加到prompt的最後面。
- 確認生成圖片尺寸(2:3, 3:2, 1:1, 付費使用者可自訂尺寸比例)
- 選擇Sampling Methods:相同的prompt依照選擇的sampling methods也會有不同的結果、風格,可視做決定風格的「第二個模型」
- 確認Samling Steps:圖片運算的步數,免費使用者上限為25,付費使用者為60,步數越大圖片的精緻度越高(免費25steps效能已經很不錯)
- 確認CFG scale:參數從1~30,數值越大運算越「依照」使用者的prompt生成,數值越小電腦運算的「藝術」自由度越高,網站建議在3~15,個人建議3~10,越高的運算越容易出現畫面、顏色的異常。
- 細節操作:
- clip skip:數值越小越遵照「每個prompt單字生成」,數值越大越依照「整體句子」生成,數值大的情況容易脫離prompt內容,建議依照預設1~2即可。
- ENSD:影響隨機seed的一組參數,可忽略。
優化圖片相關操作
Upscale
Upscale:升級圖片尺寸,自1x(一倍)像素到4x,付費者可使用custom自訂
Upscaler:可理解為一個幫圖片升級細節的模型,有特別優化於寫實&動漫風格的upscaler,皆可嘗試使用
Hires steps:優化步數,數值越大效果越高,免費使用者上限為25,付費使用者為60
Denoising Strength:重新處理整體優化的範圍以及強度,與數值成正比。建議不超過0.5
ADetailer
ADetailer Model:為修正特定細節的模型,例如手腳,臉部等
可於此處添加LoRA, prompt, negative prompt來強化想特別優化處理(排除錯誤)的部分
Detection model confidence threshold:數值高強調重繪精準度,數值低強調重繪範圍
Inpaint mask blur:數值越低圖像邊緣的重繪越銳利(sharper)
Denoising Strength:重新處理細節重繪的範圍以及強度,與數值成正比。建議不超過0.5
角色一致相關操作
生成想要的圖片後,固定seed來生成其餘的圖案
將想要增加的動作、元素放在最前面
在seed固定的情況中,調整文字順序、增加文字、調整Lora權重、及其他參數皆會產生不一樣圖案,若無「任何調整」,生成之圖片將會維持一致