「AI啟動創作魂-TensorArt生成圖片教學」修訂間的差異

出自跨校選修
跳至導覽 跳至搜尋
 
(未顯示同一使用者於中間所作的 20 次修訂)
行 1: 行 1:
[[:分類:AI啟動創作魂]]
+
[[分類:AI啟動創作魂]]
  
[[https://tensor.art/ TensorArt官網]]
+
[https://tensor.art/ TensorArt官網]<br>
 
+
[https://docs.google.com/presentation/d/1EYm-dvIm14cbHhdlWPcc7EFEZfAJlJGqb8EVFl8bUTI/edit#slide=id.g2f185d28aa0_0_427 課程講義PPTX]
前言:圖片生成網站眾多,參數多的網站供使用者更多的調整細節,在操作中可以更加了解Ai生成的要領以及需掌握的元素。也有介面較為簡單的網站供大家學習(例如DALL-E, Leonardo etc),因應教學詳細程度/網站免費使用資源多寡因此選擇TensorArt。
+
<br>
 
+
前言:圖片生成網站眾多,參數多的網站供使用者更多的調整細節,在操作中可以更加了解Ai生成的要領以及需掌握的元素。<br>
TensorArt較為開放,所有使用者都可以在上面創建自己的Model,LoRA。
+
也有介面較為簡單的網站供大家學習(例如DALL-E, Leonardo etc),因應教學詳細程度/網站免費使用資源多寡因此選擇TensorArt。<br>
 +
<br>
 +
TensorArt較為「開放」,所有使用者都可以在上面創建自己的Model,LoRA。<br>
 
<br>
 
<br>
 
===Prompt基礎優化指南===
 
===Prompt基礎優化指南===
行 22: 行 24:
 
仰角:low angles<br>
 
仰角:low angles<br>
 
俯角:high angles<br>
 
俯角:high angles<br>
 +
<br>
 +
'''常見優化prompt'''<br>
 +
materpiece, best quality, high resolution , 3D rendered , realistic style , anime style , detailed , ultra detailed, solo ,<br>
 
<br>
 
<br>
 
'''prompt權重相關'''<br>
 
'''prompt權重相關'''<br>
重要的prompt放到最前面,字數較多的時候我們可以以「加重權重」的方式來實現想要的效果
+
重要的prompt放到最前面,可以以「加重權重」的方式來嘗試凸顯想要的單字效果<br>
 
每一個單字默認權重為1.0,可以「()」加重,例(apple)為1.1,((appple))為1.2。也可直接在輸入()數字,例:(apple:1.2), (apple1.4),TensorArt語法上限為1.4,各網站不同(不建議超過1.8)<br>
 
每一個單字默認權重為1.0,可以「()」加重,例(apple)為1.1,((appple))為1.2。也可直接在輸入()數字,例:(apple:1.2), (apple1.4),TensorArt語法上限為1.4,各網站不同(不建議超過1.8)<br>
Prompt字數:每個網站所提供prompt上限字數不同,雖然可以通過加重權重的方式凸顯想要的元素,在字數一定的限制上,有時加重權重會令其他元素消失,或者出現不是想要的結果。因此良好的prompt以及精準以文字表示想要元素很重要
+
Prompt字數:每個網站所提供prompt上限字數不同,雖然可以通過加重權重的方式凸顯想要的元素,在字數一定的限制上,有時加重權重會令其他元素消失,或者出現不是想要的結果。因此良好的prompt與精準的文字敘述很重要<br>
 
+
建議生成圖片時,一開始單字不要使用太多,比較能掌握目前希望能出現的要素,prompt偏多的時候,容易出現某些單字在運算過程被蓋過、忽略而未顯示的狀況,調高特定prompt的權重時,也會有因為單一prompt權重增加擠壓到其他prompt的問題,因此確切的掌握prompt單字數量,或是使用完整的文法跟句型需要多花時間掌握已達到自己的需求。<br>
 +
<br>
 +
'''Negative prompt'''<br>
 +
任何不想要的元素。例如hat, blonde hair<br>
 +
網路上常見:bad anatomy , bad proportions , blurry, body out of frame , cross-eye , deformed , duplicate , extra limbs , extra arms, extra legs , extra fingers , low quality , low resolution , missing limbs , missing arms , missing legs , missing fingers , mutation , mutated , mutated limbs , mutated arms, mutated hands , mutated legs , bokeh<br>
 +
<br>
 
===生成圖片基礎操作===
 
===生成圖片基礎操作===
 +
'''基本名詞認識'''<br>
 +
#Model:生成圖片、影像的語言模型
 +
#LoRA:低秩適應 (LoRA) 是一種特定的微調方法,可以套用至各種模型架構<br>
 +
#Prompt:想要生成的文字內容,可以簡單的單字,或是整句句型表達皆可,一般慣用單字原因為可以逐個調整其權重,因此即使單字與句子混著使用,權重調整得宜即可
 +
<br>
 +
'''基本步驟'''<br>
 
#點擊「create-creation」以開始生成圖片
 
#點擊「create-creation」以開始生成圖片
 
#確認好想要生成的內容,若有特定想生成的細節(例如髮型、服飾、場景等等),需盡可能精細的打成prompt(單字、句子皆可),若不確定如何整理可使用ChatGPT輔助寫
 
#確認好想要生成的內容,若有特定想生成的細節(例如髮型、服飾、場景等等),需盡可能精細的打成prompt(單字、句子皆可),若不確定如何整理可使用ChatGPT輔助寫
#選擇model,model目前有分SDXL(SD1.0)、SD1.5、SD3(消耗最高、目前功能最強)
+
#選擇model,model目前有分SDXL(Stable Diffusion1.0)、SD1.5、SD3(消耗最高、目前功能最強)
 
#依照Model決定是否使用匹配的LoRA(系統會自動屏蔽不匹配模型版本的LoRA,因此點選想要的即可),使用LoRA需注意有無Trigger Words,有些LoRA需要將Trigger Words加到prompt的最後面。
 
#依照Model決定是否使用匹配的LoRA(系統會自動屏蔽不匹配模型版本的LoRA,因此點選想要的即可),使用LoRA需注意有無Trigger Words,有些LoRA需要將Trigger Words加到prompt的最後面。
 
#確認生成圖片尺寸(2:3, 3:2, 1:1, 付費使用者可自訂尺寸比例)
 
#確認生成圖片尺寸(2:3, 3:2, 1:1, 付費使用者可自訂尺寸比例)
行 41: 行 57:
 
#*ENSD:影響隨機seed的一組參數,可忽略。
 
#*ENSD:影響隨機seed的一組參數,可忽略。
 
<br>
 
<br>
 +
 
===優化圖片相關操作===
 
===優化圖片相關操作===
 
'''Upscale'''<br>
 
'''Upscale'''<br>
Upscale:升級圖片尺寸,自1x(一倍)像素到4x,付費者可使用custom自訂<br>
+
#Upscale:升級圖片尺寸,自1x(一倍)像素到4x(免費帳戶最高2x),付費者可使用custom自訂
Upscaler:可理解為一個幫圖片升級細節的模型,有特別優化於寫實&動漫風格的upscaler,皆可嘗試使用<br>
+
#Upscaler:可理解為一個幫圖片升級細節的模型,有特別優化於寫實&動漫風格的upscaler,皆可嘗試使用
Hires steps:優化步數,數值越大效果越高,免費使用者上限為25,付費使用者為60<br>
+
#Hires steps:優化步數,數值越大效果越高,免費使用者上限為25,付費使用者為60
Denoising Strength:重新處理整體優化的範圍以及強度,與數值成正比。建議不超過0.5<br>
+
#Denoising Strength:重新處理整體優化的範圍以及強度,與數值成正比。建議不超過0.5
 
'''ADetailer'''<br>
 
'''ADetailer'''<br>
ADetailer Model:為修正特定細節的模型,例如手腳,臉部等<br>
+
#ADetailer Model:為修正特定細節的模型,例如手腳,臉部等
可於此處添加LoRA, prompt, negative prompt來強化想特別優化處理(排除錯誤)的部分<br>
+
#可於此處添加LoRA, prompt, negative prompt來強化想特別優化處理(排除錯誤)的部分
Detection model confidence threshold:數值高強調重繪精準度,數值低強調重繪範圍<br>
+
#Detection model confidence threshold:數值高強調重繪精準度,數值低強調重繪範圍
Inpaint mask blur:數值越低圖像邊緣的重繪越銳利(sharper)<br>
+
#Inpaint mask blur:數值越低圖像邊緣的重繪越銳利(sharper)
Denoising Strength:重新處理細節重繪的範圍以及強度,與數值成正比。建議不超過0.5<br>
+
#Denoising Strength:重新處理細節重繪的範圍以及強度,與數值成正比。建議不超過0.5
 
<br>
 
<br>
 +
 +
===角色一致相關操作===
 +
#生成想要的圖片後,固定seed來生成其餘的圖案<br>
 +
#將想要增加的動作、元素放在最前面<br>
 +
#多利用negative prompt去除不想要的因素
 +
#在seed固定的情況中,調整文字順序、增加文字、prompt權重、調整Lora權重、及其他參數皆會產生不一樣圖案,若無「任何調整」,生成之圖片將會維持一致
 +
#使用「特定人物」的LoRA,加上自己的prompt跟negative prompt將人物修正成屬於自己的角色,便可避免綁定seed的狀況

於 2024年8月28日 (三) 13:18 的最新修訂


TensorArt官網
課程講義PPTX
前言:圖片生成網站眾多,參數多的網站供使用者更多的調整細節,在操作中可以更加了解Ai生成的要領以及需掌握的元素。
也有介面較為簡單的網站供大家學習(例如DALL-E, Leonardo etc),因應教學詳細程度/網站免費使用資源多寡因此選擇TensorArt。

TensorArt較為「開放」,所有使用者都可以在上面創建自己的Model,LoRA。

Prompt基礎優化指南

人物大小
全身照:full body shot
半身照:half body shot
側身照:sideways photo

鏡頭種類
近照:close-up
中景:medium shot
遠景:long shot, extreme long shot
斜角鏡頭:dutch angle shot (電影常用拍攝手法)

鏡位
仰角:low angles
俯角:high angles

常見優化prompt
materpiece, best quality, high resolution , 3D rendered , realistic style , anime style , detailed , ultra detailed, solo ,

prompt權重相關
重要的prompt放到最前面,可以以「加重權重」的方式來嘗試凸顯想要的單字效果
每一個單字默認權重為1.0,可以「()」加重,例(apple)為1.1,((appple))為1.2。也可直接在輸入()數字,例:(apple:1.2), (apple1.4),TensorArt語法上限為1.4,各網站不同(不建議超過1.8)
Prompt字數:每個網站所提供prompt上限字數不同,雖然可以通過加重權重的方式凸顯想要的元素,在字數一定的限制上,有時加重權重會令其他元素消失,或者出現不是想要的結果。因此良好的prompt與精準的文字敘述很重要
建議生成圖片時,一開始單字不要使用太多,比較能掌握目前希望能出現的要素,prompt偏多的時候,容易出現某些單字在運算過程被蓋過、忽略而未顯示的狀況,調高特定prompt的權重時,也會有因為單一prompt權重增加擠壓到其他prompt的問題,因此確切的掌握prompt單字數量,或是使用完整的文法跟句型需要多花時間掌握已達到自己的需求。

Negative prompt
任何不想要的元素。例如hat, blonde hair
網路上常見:bad anatomy , bad proportions , blurry, body out of frame , cross-eye , deformed , duplicate , extra limbs , extra arms, extra legs , extra fingers , low quality , low resolution , missing limbs , missing arms , missing legs , missing fingers , mutation , mutated , mutated limbs , mutated arms, mutated hands , mutated legs , bokeh

生成圖片基礎操作

基本名詞認識

  1. Model:生成圖片、影像的語言模型
  2. LoRA:低秩適應 (LoRA) 是一種特定的微調方法,可以套用至各種模型架構
  3. Prompt:想要生成的文字內容,可以簡單的單字,或是整句句型表達皆可,一般慣用單字原因為可以逐個調整其權重,因此即使單字與句子混著使用,權重調整得宜即可


基本步驟

  1. 點擊「create-creation」以開始生成圖片
  2. 確認好想要生成的內容,若有特定想生成的細節(例如髮型、服飾、場景等等),需盡可能精細的打成prompt(單字、句子皆可),若不確定如何整理可使用ChatGPT輔助寫
  3. 選擇model,model目前有分SDXL(Stable Diffusion1.0)、SD1.5、SD3(消耗最高、目前功能最強)
  4. 依照Model決定是否使用匹配的LoRA(系統會自動屏蔽不匹配模型版本的LoRA,因此點選想要的即可),使用LoRA需注意有無Trigger Words,有些LoRA需要將Trigger Words加到prompt的最後面。
  5. 確認生成圖片尺寸(2:3, 3:2, 1:1, 付費使用者可自訂尺寸比例)
  6. 選擇Sampling Methods:相同的prompt依照選擇的sampling methods也會有不同的結果、風格,可視做決定風格的「第二個模型」
  7. 確認Samling Steps:圖片運算的步數,免費使用者上限為25,付費使用者為60,步數越大圖片的精緻度越高(免費25steps效能已經很不錯)
  8. 確認CFG scale:參數從1~30,數值越大運算越「依照」使用者的prompt生成,數值越小電腦運算的「藝術」自由度越高,網站建議在3~15,個人建議3~10,越高的運算越容易出現畫面、顏色的異常。
  9. 細節操作:
    • clip skip:數值越小越遵照「每個prompt單字生成」,數值越大越依照「整體句子」生成,數值大的情況容易脫離prompt內容,建議依照預設1~2即可。
    • ENSD:影響隨機seed的一組參數,可忽略。


優化圖片相關操作

Upscale

  1. Upscale:升級圖片尺寸,自1x(一倍)像素到4x(免費帳戶最高2x),付費者可使用custom自訂
  2. Upscaler:可理解為一個幫圖片升級細節的模型,有特別優化於寫實&動漫風格的upscaler,皆可嘗試使用
  3. Hires steps:優化步數,數值越大效果越高,免費使用者上限為25,付費使用者為60
  4. Denoising Strength:重新處理整體優化的範圍以及強度,與數值成正比。建議不超過0.5

ADetailer

  1. ADetailer Model:為修正特定細節的模型,例如手腳,臉部等
  2. 可於此處添加LoRA, prompt, negative prompt來強化想特別優化處理(排除錯誤)的部分
  3. Detection model confidence threshold:數值高強調重繪精準度,數值低強調重繪範圍
  4. Inpaint mask blur:數值越低圖像邊緣的重繪越銳利(sharper)
  5. Denoising Strength:重新處理細節重繪的範圍以及強度,與數值成正比。建議不超過0.5


角色一致相關操作

  1. 生成想要的圖片後,固定seed來生成其餘的圖案
  2. 將想要增加的動作、元素放在最前面
  3. 多利用negative prompt去除不想要的因素
  4. 在seed固定的情況中,調整文字順序、增加文字、prompt權重、調整Lora權重、及其他參數皆會產生不一樣圖案,若無「任何調整」,生成之圖片將會維持一致
  5. 使用「特定人物」的LoRA,加上自己的prompt跟negative prompt將人物修正成屬於自己的角色,便可避免綁定seed的狀況