2.5 KiB
2.5 KiB
Cara Running GPT Training
- Siapkan file HSCodeMasterBPS.pdf dari https://www.bps.go.id/assets/docs/HSCode%20Master%20BPS.pdf
- Siapkan file seluruh list import dari oracle sesuai format tblPibDtl.xlsx
- Siapkan dokumen koreksi hs code dari bea cukai sesuai dengan format MensaResumeHs.xlsx
- Applikasi hanya bisa dijalankan di linux, dikarenakan adanya library python yang tidak bisa dipkaai di windows
- Install Anaconda / Mini Conda. URL ada di https://www.anaconda.com/download/success
- Buat virtual environment di conda dengan menjalankan command berikut
conda create -f environment.yml
- Aktivasi conda virtual environment
conda activate mensa-gpt
- Untuk memastikan library telah terdownload jalankan conda environment update
conda env update --file environment.yml
- Update open api key di dalam gpt_training, serta update gpt model apabila diperlukan
- Jalankan main.py dengan python
python main.py
Konfigurasi tambahan
Konfigurasi File HS Code BPS
- Apabila ada perubahan halaman HS Code terbaru, silahkan update file
insw_scarapper.pypada line 28. Rubah nilaistart_pagedengan nilai yang sesuai - Nama file PDF serta path dari file tersebut dapat di sesuaikan di main.py pada pemanggilan fungsi
create_gpt_training_datadi parameterhscode_bps_pdf
Konfigurasi Dokumen Import Mensa
- Sistem hanya menerima format file xlsx
- Nama file excel serta path dari file tersebut dapat di sesuaikan di main.py pada pemanggilan fungsi
create_gpt_training_datadi parametermensa_import_excel - Usahakan menggunakan format yang sama persis seperti contoh. Apabila ada perubahan, penyesuaian dapat dilakukan di
file
insw_scarapper.pypada line 37, dimana kolom A pada excel terdapat pada array index ke 0
Konfigurasi Dokumen koreksi hs code dari bea cukai
- Sistem hanya menerima format file xlsx
- Nama file excel serta path dari file tersebut dapat di sesuaikan di main.py pada pemanggilan fungsi
create_gpt_training_datadi parametermensa_custom_correction_excel -
- Usahakan menggunakan format yang sama persis seperti contoh. Apabila ada perubahan, penyesuaian dapat dilakukan di
file
insw_scarapper.pypada line 46 dan 44, dimana kolom A pada excel terdapat pada array index ke 0
- Usahakan menggunakan format yang sama persis seperti contoh. Apabila ada perubahan, penyesuaian dapat dilakukan di
file
- line 44 digunakan untuk mengecek apakah hs code dari row tersebut kosong, sebagai indikator empty row
- parameter usecols pada line 41 digunakan untuk memotong data yang terlalu besar dengan cara mengambil data dari kolom tertentu saja