0604
Github Repo - ./tutorials/ ์ LLaVA training code upload (์ฑํ. ์ฌ๋ ค์ฃผ์๊ณ ํก๋ฐฉ์ ์๋ ค์ฃผ์ธ์ฉ)
Colab์์ LLaVA ๋๋ฆฌ๊ธฐ (๋ชจ๋)
โข
option) Colab์์ KoVicuna model LLaVA์ ์ ์ฉ (๋ชจ๋)
Pretraining dataset ๋ฒ์ญ
โข
CC595K โ KOCCM์์ filtering (ํ๋ฐฑ)
Finetuning dataset ๋ฒ์ญ
โข
conversation 58K (ํ๋ฐฑ โ ์ ํ, ์น์ฐ)
Huggingface dataset upload ํด๋ณด๊ธฐ (ํ๋ฐฑ)
KULLM, KoRWKV ์คํ (์ฑ์ฐ)
0611
Colab์์ KoLLaVA ํ์ต ์ฝ๋, ์ด๋ฏธ์ง ๋ค์ด ๋ฐฉ๋ฒ ๊ณต์ - ํ๋ฐฑ
LoRA, QLoRA ๊ฐ๋จ ๋ฆฌ๋ทฐ - ์น์ฐ, ์ ํ
ํ๊ตญ์ด ํนํ ๋ฐ์ดํฐ์
์กฐ์ฌ (์ผํ๋ชฐ ๋ฐ์ดํฐ) - ์ฑํ
0618
์คํฐ๋ ์ด๋ฆ ์นดํก๋ฐฉ์ ์ธ๋น 3๊ฐ์ฉ ์ฌ๋ฆฌ๊ธฐ - ๋ชจ๋
keyword: korean, language model, spring lounge, climbing, โฆ
์คํฐ๋ ํ๋ณด๊ธ ์์ฑ
NIPA ์๋ฒ์์ ํ์ต - ์น์ฐ, ์ฑํ
ํ๊ตญ์ด ๋ฐ์ดํฐ์
์์
โข
์คํ์์ค ํ๊ตญ์ด ๋ฐ์ดํฐ์
์๋์ง
โข
์ด๋ฏธ์ง ์บก์
๋ฐ์ดํฐ์
๋ ์ฐพ๊ธฐ (์บก์
โ ํ๋กฌํํธ๋ก ๋ง๋ค๊ธฐ)
LLM ๋ชจ๋ธ quantization ์์๋ณด๊ธฐ
Quantization ๊ฐ๋ฅํ ์ง
0625
๊ฐ์ ํ๋์ task ์ ํด ์งํํ๊ธฐ
General LMM
1.
Size up
a.
8ibt์ผ๋ก ํ์ต
2.
Otter ๊ฐ์ : ํ๋ฐฑ
3.
ํ๊ตญ์ด visual instruction ๋ฐ์ดํฐ์
๊ตฌ์ถ : ์ฑํ
Task-specific LMM
1.
Fine-task ์กฐ์ฌ(๋ฐ์ดํฐ์
, ์ฌ์ฉ์ ๋์ฆ ๋ฑ) : ์ฑํ, ์น์ฐ
โข
โข
ํ๊ตญ์ด ์ํ, ๊ณผํ ๋ฌธ์ ํ์ด ๋ฐ์ดํฐ์
โข
์ถ๊ฐ fine-task ๋ฐ์ดํฐ์
์์๋ณด๊ธฐ
0702
Fashion
โข
instruction dataset ๋ง๋ค๊ธฐ ์ํ ๋ฐ์ดํฐ์
์กฐ์ฌ
โฆ
AI-Hub
โฆ
FashionGen, DeepFashion ํจ์
์ด๋ฏธ์ง-์บก์
๋ฐ์ดํฐ์
โข
Insturction ๋ฐ์ดํฐ ์์ฑํ๊ธฐ ์ํ ํ๋กฌํํธ
โฆ
๊ธฐ์กด ์ด๋ป๊ฒ ๋ง๋ค์๋์ง ์กฐ์ฌ, ํจ์
์ ํนํํด์ ์ด๋ป๊ฒ ์ฌ์ฉํ๋ฉด ์ข์์ง
๋น๋์ค ๋ผ๋ง
โข
๋น๋์ค ๊ด๋ จ ๋ฐ์ดํฐ์
์ ํ๊ธ ๋ฒ์ญ ์ฌ์ฉ
์ด๋ฏธ์ง ๊ด๋ จ ๋ํ + ์ด๋ฏธ์ง ์์ฑ
0723
์ด๋ฏธ์ง โ ์์ ์์ฑ
ํ ์ ๋ด์ฉ
์ด๋ฏธ์ง โ text : LLaVA
text โ ์์
: MusicGen
โข
SNS์ ์ฌ์ง์ ์ฌ๋ฆฌ๊ฒ ๋๋ฉด ์ฌ์ง๊ณผ ๊ด๋ จ๋ ์์
โข
๋ฏธ์ ๊ด์์ ๊ทธ๋ฆผ์ ๋ง๋ ์์
์ ์์ฑ
๋ค๋ฅธ ๊ฐ์๊ฐ ๋ถ๋ฅธ ์ปค๋ฒ ์์ฑ
์ฝ๋ ์งํ์ ๋ํ Chat GPT์์ ๋ ผ์
1.
๋
ผ๋ฌธ
a.
b.
c.
2.
BGM ์์ฅ ์กฐ์ฌ (์ฑ์ฐ, ์ฑํ)
a.
๊ธฐ์กด BGM ์์ฅ์ ์๋น์, ๊ณต๊ธ์ ๊ด์ ์์ ์กฐ์ฌ
b.
์ด๋ฏธ์ง โ ์์
ํน์ ๋ค๋ฅธ ai ๋ชจ๋ธ์ ๋ง๋ค์์ ๋ ์ฌ์ฉํ ๊ฑฐ๋ผ ์์๋๋ ์๋น์ ํ๋ฅด์๋
c.
๋๋ฉํ์ด์ง ์ ์ ๋ฐ ๋ง์ผํ
d.
์ ์ํ ์ํ ๋ฐฐ๊ฒฝ์์
์์ฑ ๋์ฆ ํ์ธ