File size: 2,441 Bytes
bcb1848
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
"""
A
"""
# ๋ฏธ๋ฆฌ ์„ค์ •๋œ ์ธ์ˆ˜๋“ค
from argparse import ArgumentParser

# ์‚ฌ์šฉ์ž ์„ ์ • ๋ณ€์ˆ˜๋“ค
ROOT_DIR = ""  # ํ”„๋กœ์ ํŠธ ๋ฃจํŠธ ๋””๋ ‰ํ† ๋ฆฌ ๊ฒฝ๋กœ 
BERT_PRETRAINED_DIR = "klue/roberta-large"  # BERT ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ๋ชจ๋ธ ๋””๋ ‰ํ† ๋ฆฌ ๊ฒฝ๋กœ
DATA_PREFIX = "data"  # ๋ฐ์ดํ„ฐ ํŒŒ์ผ๋“ค์˜ ์ƒ์œ„ ๋””๋ ‰ํ† ๋ฆฌ ๊ฒฝ๋กœ
CHECKPOINT_DIR = 'model'  # ๋ชจ๋ธ ์ฒดํฌํฌ์ธํŠธ ์ €์žฅ ๋””๋ ‰ํ† ๋ฆฌ ๊ฒฝ๋กœ
LOG_FATH = 'logs'  # ํ›ˆ๋ จ ๋กœ๊ทธ ์ €์žฅ ๋””๋ ‰ํ† ๋ฆฌ ๊ฒฝ๋กœ

def get_train_args():
    """
    ํ›ˆ๋ จ ์ธ์ˆ˜ ์„ค์ •
    """
    parser = ArgumentParser(description='I_S', allow_abbrev=False)

    # ์ธ์ˆ˜ ํŒŒ์‹ฑ
    parser.add_argument('--model_name', type=str, default='KCSN')  

    # ๋ชจ๋ธ ์„ค์ •
    parser.add_argument('--pooling_type', type=str, default='max_pooling')  
    parser.add_argument('--classifier_intermediate_dim', type=int, default=100) 
    parser.add_argument('--nonlinear_type', type=str, default='tanh')  

    # BERT ์„ค์ •
    parser.add_argument('--bert_pretrained_dir', type=str, default=BERT_PRETRAINED_DIR)  

    # ํ›ˆ๋ จ ์„ค์ •
    parser.add_argument('--margin', type=float, default=1.0)  
    parser.add_argument('--lr', type=float, default=2e-5)  
    parser.add_argument('--optimizer', type=str, default='adam')  
    parser.add_argument('--dropout', type=float, default=0.5)  
    parser.add_argument('--num_epochs', type=int, default=50)  
    parser.add_argument('--batch_size', type=int, default=16)  
    parser.add_argument('--lr_decay', type=float, default=0.95)  
    parser.add_argument('--patience', type=int, default=10)  

    # ํ›ˆ๋ จ, ๊ฐœ๋ฐœ ๋ฐ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ ํŒŒ์ผ ๊ฒฝ๋กœ
    parser.add_argument('--train_file', type=str, default=f'{DATA_PREFIX}/train_unsplit.txt')
    parser.add_argument('--dev_file', type=str, default=f'{DATA_PREFIX}/dev_unsplit.txt')
    parser.add_argument('--test_file', type=str, default=f'{DATA_PREFIX}/test_unsplit.txt')
    parser.add_argument('--name_list_path', type=str, default=f'{DATA_PREFIX}/name_list.txt')
    parser.add_argument('--ws', type=int, default=10)  # ์œˆ๋„์šฐ ํฌ๊ธฐ

    parser.add_argument('--length_limit', type=int, default=510)  # ์‹œํ€€์Šค ๊ธธ์ด ์ œํ•œ

    # ์ฒดํฌํฌ์ธํŠธ ๋ฐ ๋กœ๊ทธ ์ €์žฅ ๋””๋ ‰ํ† ๋ฆฌ
    parser.add_argument('--checkpoint_dir', type=str, default=CHECKPOINT_DIR)
    parser.add_argument('--training_logs', type=str, default=LOG_FATH)

    args, _ = parser.parse_known_args()

    return args