https://velog.io/@dongyoungkim/GPT-fine-tuning-8.-supervised-fine-tuning GPT fine-tuning - 8. supervised fine-tuning여러 매체를 통해 GPT 의 성능이 그 크기에서 유래한다고 알려진것과는 상당해 다른 결과입니다. 1B 이 결코 작은 모델이 아니지만, 국내외적으로 많은 기업들이 거대모델의 기준을 175B 으로 잡고velog.io https://huggingface.co/docs/trl/sft_trainer Supervised Fine-tuning Trainer huggingface.co https://velog.io/@wkshin89/Paper-Review-Training-Compute-Optimal-Large-La..
SLLM SFT (Small Large Language Model Supervised fine tuning), RAG
https://velog.io/@dongyoungkim/GPT-fine-tuning-8.-supervised-fine-tuning GPT fine-tuning - 8. supervised fine-tuning여러 매체를 통해 GPT 의 성능이 그 크기에서 유래한다고 알려진것과는 상당해 다른 결과입니다. 1B 이 결코 작은 모델이 아니지만, 국내외적으로 많은 기업들이 거대모델의 기준을 175B 으로 잡고velog.io https://huggingface.co/docs/trl/sft_trainer Supervised Fine-tuning Trainer huggingface.co https://velog.io/@wkshin89/Paper-Review-Training-Compute-Optimal-Large-La..
2024.04.29