AI啟動創作魂-TensorArt生成圖片教學

出自跨校選修
於 2024年8月16日 (五) 10:33 由 譚翰駿討論 | 貢獻 所做的修訂
跳至導覽 跳至搜尋

分類:AI啟動創作魂

[TensorArt官網]
[課程講義PPTX]
前言:圖片生成網站眾多,參數多的網站供使用者更多的調整細節,在操作中可以更加了解Ai生成的要領以及需掌握的元素。
也有介面較為簡單的網站供大家學習(例如DALL-E, Leonardo etc),因應教學詳細程度/網站免費使用資源多寡因此選擇TensorArt。

TensorArt較為「開放」,所有使用者都可以在上面創建自己的Model,LoRA。

Prompt基礎優化指南

人物大小
全身照:full body shot
半身照:half body shot
側身照:sideways photo

鏡頭種類
近照:close-up
中景:medium shot
遠景:long shot, extreme long shot
斜角鏡頭:dutch angle shot (電影常用拍攝手法)

鏡位
仰角:low angles
俯角:high angles

常見優化prompt
materpiece, best quality, high resolution , 3D rendered , realistic style , anime style , detailed , ultra detailed, solo ,

prompt權重相關
重要的prompt放到最前面,可以以「加重權重」的方式來嘗試凸顯想要的單字效果
每一個單字默認權重為1.0,可以「()」加重,例(apple)為1.1,((appple))為1.2。也可直接在輸入()數字,例:(apple:1.2), (apple1.4),TensorArt語法上限為1.4,各網站不同(不建議超過1.8)
Prompt字數:每個網站所提供prompt上限字數不同,雖然可以通過加重權重的方式凸顯想要的元素,在字數一定的限制上,有時加重權重會令其他元素消失,或者出現不是想要的結果。因此良好的prompt與精準的文字敘述很重要

Negative prompt
任何不想要的元素。例如hat, blonde hair
網路上常見:bad anatomy , bad proportions , blurry, body out of frame , cross-eye , deformed , duplicate , extra limbs , extra arms, extra legs , extra fingers , low quality , low resolution , missing limbs , missing arms , missing legs , missing fingers , mutation , mutated , mutated limbs , mutated arms, mutated hands , mutated legs , bokeh

生成圖片基礎操作

基本名詞認識

  1. Model:生成圖片、影像的語言模型
  2. LoRA:低秩適應 (LoRA) 是一種特定的微調方法,可以套用至各種模型架構
  3. Prompt:想要生成的文字內容,可以簡單的單字,或是整句句型表達皆可,一般慣用單字原因為可以逐個調整其權重,因此即使單字與句子混著使用,權重調整得宜即可


基本步驟

  1. 點擊「create-creation」以開始生成圖片
  2. 確認好想要生成的內容,若有特定想生成的細節(例如髮型、服飾、場景等等),需盡可能精細的打成prompt(單字、句子皆可),若不確定如何整理可使用ChatGPT輔助寫
  3. 選擇model,model目前有分SDXL(Stable Diffusion1.0)、SD1.5、SD3(消耗最高、目前功能最強)
  4. 依照Model決定是否使用匹配的LoRA(系統會自動屏蔽不匹配模型版本的LoRA,因此點選想要的即可),使用LoRA需注意有無Trigger Words,有些LoRA需要將Trigger Words加到prompt的最後面。
  5. 確認生成圖片尺寸(2:3, 3:2, 1:1, 付費使用者可自訂尺寸比例)
  6. 選擇Sampling Methods:相同的prompt依照選擇的sampling methods也會有不同的結果、風格,可視做決定風格的「第二個模型」
  7. 確認Samling Steps:圖片運算的步數,免費使用者上限為25,付費使用者為60,步數越大圖片的精緻度越高(免費25steps效能已經很不錯)
  8. 確認CFG scale:參數從1~30,數值越大運算越「依照」使用者的prompt生成,數值越小電腦運算的「藝術」自由度越高,網站建議在3~15,個人建議3~10,越高的運算越容易出現畫面、顏色的異常。
  9. 細節操作:
    • clip skip:數值越小越遵照「每個prompt單字生成」,數值越大越依照「整體句子」生成,數值大的情況容易脫離prompt內容,建議依照預設1~2即可。
    • ENSD:影響隨機seed的一組參數,可忽略。


優化圖片相關操作

Upscale

  1. Upscale:升級圖片尺寸,自1x(一倍)像素到4x,付費者可使用custom自訂
  2. Upscaler:可理解為一個幫圖片升級細節的模型,有特別優化於寫實&動漫風格的upscaler,皆可嘗試使用
  3. Hires steps:優化步數,數值越大效果越高,免費使用者上限為25,付費使用者為60
  4. Denoising Strength:重新處理整體優化的範圍以及強度,與數值成正比。建議不超過0.5

ADetailer

  1. ADetailer Model:為修正特定細節的模型,例如手腳,臉部等
  2. 可於此處添加LoRA, prompt, negative prompt來強化想特別優化處理(排除錯誤)的部分
  3. Detection model confidence threshold:數值高強調重繪精準度,數值低強調重繪範圍
  4. Inpaint mask blur:數值越低圖像邊緣的重繪越銳利(sharper)
  5. Denoising Strength:重新處理細節重繪的範圍以及強度,與數值成正比。建議不超過0.5


角色一致相關操作

  1. 生成想要的圖片後,固定seed來生成其餘的圖案
  2. 將想要增加的動作、元素放在最前面
  3. 多利用negative prompt去除不想要的因素
  4. 在seed固定的情況中,調整文字順序、增加文字、prompt權重、調整Lora權重、及其他參數皆會產生不一樣圖案,若無「任何調整」,生成之圖片將會維持一致