SemEval2025-Emotion-Analysis

Language	Track A	Track C
Indonesian	-	dev
Javanese	-	dev
Sundanese	train, dev	train, dev

Sundanese Track A: Multi-label Emotion Classification

NusaBERT Fine-tuning

accelerate launch src/run_multilabel_classification.py \
    --model_checkpoint LazarusNLP/NusaBERT-large \
    --num_train_epochs 100 \
    --optim adamw_torch_fused \
    --learning_rate 1e-5 \
    --weight_decay 0.01 \
    --per_device_train_batch_size 8 \
    --per_device_eval_batch_size 32 \
    --early_stopping_patience 10 \
    --bf16

Dev Acc: 0.48-0.52

Gemma2-9b-SEA-LION-v3 SFT

accelerate launch src/run_sft_qlora.py \
    --model_checkpoint "gemma2-9b-cpt-sea-lion-v3-base-SemEval-sun" \
    --max_length 128 \
    --batch_size 32 \
    --learning_rate 2e-4 \
    --max_grad_norm 1.0 \
    --warmup_steps 20 \
    --num_epochs 5 \
    --gradient_checkpointing \
    --apply_liger_kernel_to_gemma2

accelerate launch src/eval_emotion.py \
    --model_checkpoint "models/gemma2-9b-cpt-sea-lion-v3-base-SemEval-sun" \
    --apply_liger_kernel_to_gemma2

Dev Acc: 0.57

Gemma2-9b-SahabatAI-v1 SFT

accelerate launch src/run_sft_qlora.py \
    --model_checkpoint "GoToCompany/gemma2-9b-cpt-sahabatai-v1-base" \
    --max_length 128 \
    --batch_size 32 \
    --learning_rate 2e-4 \
    --max_grad_norm 1.0 \
    --warmup_steps 20 \
    --num_epochs 5 \
    --gradient_checkpointing \
    --apply_liger_kernel_to_gemma2

accelerate launch src/eval_emotion.py \
    --model_checkpoint "models/gemma2-9b-cpt-sahabatai-v1-base" \
    --apply_liger_kernel_to_gemma2

Dev Acc: 0.61

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
data		data
notebooks		notebooks
src		src
synthetic_data/train/track_a		synthetic_data/train/track_a
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
run_eval_emotion.sh		run_eval_emotion.sh
run_eval_instruct_emotion.sh		run_eval_instruct_emotion.sh
run_mlm.sh		run_mlm.sh
run_multilabel_classification.sh		run_multilabel_classification.sh
run_multilabel_classification_spanemo.sh		run_multilabel_classification_spanemo.sh
run_sft_instruct_qlora.sh		run_sft_instruct_qlora.sh
run_sft_qlora.sh		run_sft_qlora.sh
run_translate.sh		run_translate.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

SemEval2025-Emotion-Analysis

Sundanese Track A: Multi-label Emotion Classification

NusaBERT Fine-tuning

Gemma2-9b-SEA-LION-v3 SFT

Gemma2-9b-SahabatAI-v1 SFT

TODOs

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

LazarusNLP/SemEval2025-Emotion-Analysis

Folders and files

Latest commit

History

Repository files navigation

SemEval2025-Emotion-Analysis

Sundanese Track A: Multi-label Emotion Classification

NusaBERT Fine-tuning

Gemma2-9b-SEA-LION-v3 SFT

Gemma2-9b-SahabatAI-v1 SFT

TODOs

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages