Weyaxi commited on Apr 23

Commit

4413631

•

1 Parent(s): 14ad274

add data trained to make this model

Files changed (17) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,16 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+data/airoboros_3.2_without_contextual_slimorca_orca_sharegpt.json filter=lfs diff=lfs merge=lfs -text
+data/allenai_wild_chat_gpt4_english_toxic_random_half_4k_sharegpt.json filter=lfs diff=lfs merge=lfs -text
+data/capybara_sharegpt.json filter=lfs diff=lfs merge=lfs -text
+data/cot_alpaca_gpt4_extracted_openhermes_2.5_sharegpt.json filter=lfs diff=lfs merge=lfs -text
+data/gpt4_data_lmys_1m_sharegpt.json filter=lfs diff=lfs merge=lfs -text
+data/gpteacher-instruct-special-alpaca.json filter=lfs diff=lfs merge=lfs -text
+data/merged_all.json filter=lfs diff=lfs merge=lfs -text
+data/no_robots_sharegpt.json filter=lfs diff=lfs merge=lfs -text
+data/pippa_bagel_repo_3k_sharegpt.json filter=lfs diff=lfs merge=lfs -text
+data/sharegpt_gpt4_english.json filter=lfs diff=lfs merge=lfs -text
+data/slimorca_dedup_filtered_95k_sharegpt.json filter=lfs diff=lfs merge=lfs -text
+data/synthia-v1.3_sharegpt_12500.json filter=lfs diff=lfs merge=lfs -text
+data/wizardlm_evol_instruct_70k_random_half.json filter=lfs diff=lfs merge=lfs -text

data/airoboros_3.2_without_contextual_slimorca_orca_sharegpt.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:22b3140cce72bfaad2ae423c2c9bafd9ce128cf7820e8be3b9f6d415390c5689
+size 89066312

data/allenai_wild_chat_gpt4_english_toxic_random_half_4k_sharegpt.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:a90d2b0fcc3d94f9d5f61ffe52359003020a983b019400c940664fd24932a448
+size 26506815

data/capybara_sharegpt.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:a1947d28999416a2f468d1e09654cfdfc9bab8ccd03aa184598d20f0000dd6e4
+size 76361785

data/cot_alpaca_gpt4_extracted_openhermes_2.5_sharegpt.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4a037af5bf62d30414b85d036c09c0f860922f66c3e7fd701abf809f7fc94c32
+size 40074062

data/everythinglm-data-v3_sharegpt.json ADDED Viewed

The diff for this file is too large to render. See raw diff

data/gpt4_data_lmys_1m_sharegpt.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:220eb5d5db82ce81289be08e1a0542c72e13fc919658c5f5b50f5dafd8e108cf
+size 29572874

data/gpteacher-instruct-special-alpaca.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:598d08b29655a0da79c9c1b290431c4d22d0533231a29cb048d1056e19d95c97
+size 12187144

data/merged_all.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:24ddc1528923e569d091d249e43866b0b3c8486fe6723a0c9431f613ec4b9f91
+size 662813228

data/no_robots_sharegpt.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b72678e8b5edf079068ef4c6ee55690bb2437f5f1ff9c7e99a34a0175a950748
+size 12679964

data/oasst_top1_from_fusechatmixture_sharegpt.json ADDED Viewed

The diff for this file is too large to render. See raw diff

data/pippa_bagel_repo_3k_sharegpt.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:df2121d98d19e3e1e0fc873390486df71c2f502f309eaafd5af45f3c151cfe4f
+size 18361804

data/remove_empty_output.py ADDED Viewed

+import json
+with open('merged_all.json', 'r') as file:
+    data = json.load(file)
+print(f"Normal len: {len(data)}")
+data = [row for row in data if row["output"] != ""]
+print(f"After len: {len(data)}")
+with open('merged_all.json', 'w') as file:
+    json.dump(data, file, indent=1)

data/sharegpt_gpt4_english.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1512057e9002710757d6d8478b6678138fd878ac5844866d602b7cb7fd3e9c41
+size 78552993

data/slimorca_dedup_filtered_95k_sharegpt.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:302e8d78b1f5f08bb7dd0ab7ded0204935003aea0b4c5bdbd8821d8924ab15f8
+size 227955996

data/synthia-v1.3_sharegpt_12500.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:dbdbc7413a3c7fc65a900518f0db8627bb5ced53e1e8ee82613d09856c1b3b70
+size 30638009

data/wizardlm_evol_instruct_70k_random_half.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:41512805955ac47820191fd307a7eea1123dc1f163332f545137cee3182153b4
+size 62604075