AI啟動創作魂-TensorArt生成圖片教學

分類:AI啟動創作魂

[TensorArt官網]
[課程講義PPTX]
前言：圖片生成網站眾多，參數多的網站供使用者更多的調整細節，在操作中可以更加了解Ai生成的要領以及需掌握的元素。
也有介面較為簡單的網站供大家學習(例如DALL-E, Leonardo etc)，因應教學詳細程度/網站免費使用資源多寡因此選擇TensorArt。

TensorArt較為「開放」，所有使用者都可以在上面創建自己的Model，LoRA。

Prompt基礎優化指南

人物大小
全身照:full body shot
半身照:half body shot
側身照:sideways photo

鏡頭種類
近照:close-up
中景:medium shot
遠景:long shot, extreme long shot
斜角鏡頭:dutch angle shot (電影常用拍攝手法)

鏡位
仰角:low angles
俯角:high angles

常見優化prompt
materpiece, best quality, high resolution , 3D rendered , realistic style , anime style , detailed , ultra detailed, solo ,

prompt權重相關
重要的prompt放到最前面，可以以「加重權重」的方式來嘗試凸顯想要的單字效果
每一個單字默認權重為1.0，可以「()」加重，例(apple)為1.1，((appple))為1.2。也可直接在輸入()數字，例：(apple:1.2), (apple1.4)，TensorArt語法上限為1.4，各網站不同(不建議超過1.8)
Prompt字數：每個網站所提供prompt上限字數不同，雖然可以通過加重權重的方式凸顯想要的元素，在字數一定的限制上，有時加重權重會令其他元素消失，或者出現不是想要的結果。因此良好的prompt與精準的文字敘述很重要
建議生成圖片時，一開始單字不要使用太多，比較能掌握目前希望能出現的要素，prompt偏多的時候，容易出現某些單字在運算過程被蓋過、忽略而未顯示的狀況，調高特定prompt的權重時，也會有因為單一prompt權重增加擠壓到其他prompt的問題，因此確切的掌握prompt單字數量，或是使用完整的文法跟句型需要多花時間掌握已達到自己的需求。

Negative prompt
任何不想要的元素。例如hat, blonde hair
網路上常見:bad anatomy , bad proportions , blurry, body out of frame , cross-eye , deformed , duplicate , extra limbs , extra arms, extra legs , extra fingers , low quality , low resolution , missing limbs , missing arms , missing legs , missing fingers , mutation , mutated , mutated limbs , mutated arms, mutated hands , mutated legs , bokeh

生成圖片基礎操作

基本名詞認識

Model:生成圖片、影像的語言模型
LoRA:低秩適應 (LoRA) 是一種特定的微調方法，可以套用至各種模型架構
Prompt:想要生成的文字內容，可以簡單的單字，或是整句句型表達皆可，一般慣用單字原因為可以逐個調整其權重，因此即使單字與句子混著使用，權重調整得宜即可

基本步驟

點擊「create-creation」以開始生成圖片
確認好想要生成的內容，若有特定想生成的細節(例如髮型、服飾、場景等等)，需盡可能精細的打成prompt(單字、句子皆可)，若不確定如何整理可使用ChatGPT輔助寫
選擇model，model目前有分SDXL(Stable Diffusion1.0)、SD1.5、SD3(消耗最高、目前功能最強)
依照Model決定是否使用匹配的LoRA(系統會自動屏蔽不匹配模型版本的LoRA，因此點選想要的即可)，使用LoRA需注意有無Trigger Words，有些LoRA需要將Trigger Words加到prompt的最後面。
確認生成圖片尺寸(2:3, 3:2, 1:1, 付費使用者可自訂尺寸比例)
選擇Sampling Methods:相同的prompt依照選擇的sampling methods也會有不同的結果、風格，可視做決定風格的「第二個模型」
確認Samling Steps:圖片運算的步數，免費使用者上限為25，付費使用者為60，步數越大圖片的精緻度越高(免費25steps效能已經很不錯)
確認CFG scale:參數從1~30，數值越大運算越「依照」使用者的prompt生成，數值越小電腦運算的「藝術」自由度越高，網站建議在3~15，個人建議3~10，越高的運算越容易出現畫面、顏色的異常。
細節操作:
- clip skip:數值越小越遵照「每個prompt單字生成」，數值越大越依照「整體句子」生成，數值大的情況容易脫離prompt內容，建議依照預設1~2即可。
- ENSD:影響隨機seed的一組參數，可忽略。

優化圖片相關操作

Upscale

Upscale:升級圖片尺寸，自1x(一倍)像素到4x，付費者可使用custom自訂
Upscaler:可理解為一個幫圖片升級細節的模型，有特別優化於寫實&動漫風格的upscaler，皆可嘗試使用
Hires steps:優化步數，數值越大效果越高，免費使用者上限為25，付費使用者為60
Denoising Strength:重新處理整體優化的範圍以及強度，與數值成正比。建議不超過0.5

ADetailer

ADetailer Model:為修正特定細節的模型，例如手腳，臉部等
可於此處添加LoRA, prompt, negative prompt來強化想特別優化處理(排除錯誤)的部分
Detection model confidence threshold:數值高強調重繪精準度，數值低強調重繪範圍
Inpaint mask blur:數值越低圖像邊緣的重繪越銳利(sharper)
Denoising Strength:重新處理細節重繪的範圍以及強度，與數值成正比。建議不超過0.5

角色一致相關操作

生成想要的圖片後，固定seed來生成其餘的圖案
將想要增加的動作、元素放在最前面
多利用negative prompt去除不想要的因素
在seed固定的情況中，調整文字順序、增加文字、prompt權重、調整Lora權重、及其他參數皆會產生不一樣圖案，若無「任何調整」，生成之圖片將會維持一致

AI啟動創作魂-TensorArt生成圖片教學

目錄

Prompt基礎優化指南

生成圖片基礎操作

優化圖片相關操作

角色一致相關操作

導覽選單

搜尋