Metadata-Version: 2.1
Name: bribrain
Version: 1.3.4
Summary: BRIBrain Standardization Code
Author: Andri Ariyanto
Author-email: ariyant.andri@gmail.com
Keywords: bribrain,edm,bri,gondrol,andri ariyanto
Classifier: Programming Language :: Python :: 3
Classifier: Operating System :: Unix
Classifier: Operating System :: MacOS :: MacOS X
Classifier: Operating System :: Microsoft :: Windows
Description-Content-Type: text/markdown
Requires-Dist: mysql-connector-python==8.0.28
Requires-Dist: psycopg2
Requires-Dist: openpyxl

# 📦 BRIBrain

[![Python Version](https://img.shields.io/badge/python-3.x-blue.svg)](https://www.python.org/)
[![PyPI version](https://img.shields.io/pypi/v/bribrain.svg)](https://pypi.org/project/bribrain/)
[![License](https://img.shields.io/badge/license-MIT-green.svg)](LICENSE)

**BRIBrain** adalah Python package standar yang digunakan sebagai library untuk proses data engineering di Departemen BRIBrain. Package ini menyediakan berbagai modul untuk konfigurasi Spark, ingestion data, penulisan data ke berbagai target (Hive, PostgreSQL, MySQL, HDFS, Excel), utility functions, metadata, dan notifikasi via Telegram.

---

## 📋 Daftar Isi

- [Instalasi](#-instalasi)
- [Quick Start](#-quick-start)
- [Modul](#-modul)
  - [Config](#1-config---konfigurasi-spark-session)
  - [Function](#2-function---utility-functions)
  - [Ingestion](#3-ingestion---standard-ingestion-ke-hive)
  - [Load](#4-load---penulisan-data-ke-berbagai-target)
  - [Metadata](#5-metadata---informasi-environment)
  - [Notification](#6-notification---notifikasi-telegram)
- [Dependencies](#-dependencies)
- [Author](#-author)

---

## 🚀 Instalasi

Gunakan package manager [pip](https://pip.pypa.io/en/stable/) untuk menginstal bribrain.

```bash
pip install bribrain
```

---

## ⚡ Quick Start

```python
import bribrain

# Membuat Spark Session
spark = bribrain.sparkSession()

# Mendapatkan list partisi dari tabel Hive
partitions = bribrain.get_list_partition(spark, "schema_name", "table_name")

# Menulis DataFrame ke Hive
bribrain.load_to_hive(spark, df, schema="my_schema", table="my_table")
```

---

## 📚 Modul

### 1. Config — Konfigurasi Spark Session

Modul untuk membuat dan mengkonfigurasi Spark Session.

<details>
<summary><b><code>sparkSession()</code></b> — Membuat Spark Session</summary>
<br>

Membuat spark session yang dapat digunakan untuk proses data engineering.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `appname` | `str` | `"Bribrain Packages SparkSession"` | Nama dari Spark Session |
| `executor` | `str` | `"small"` | Standard resource (`small`, `medium`, `high`, `custom`) |
| `instances` | `int` | `2` | Jumlah instance Spark Session |
| `cores` | `int` | `2` | Jumlah cores Spark Session |
| `memory` | `int` | `4` | Memory Spark Session (GB) |
| `overhead` | `int` | `2` | Overhead memory Spark Session (GB) |
| `verbose` | `bool` | `False` | Menampilkan console progress |
| `extra_configs` | `dict` | `None` | Additional Spark config |

**Preset Executor:**

| Executor | Instances | Cores | Memory | Overhead |
|---|---|---|---|---|
| `small` | 2 | 2 | 4 GB | 2 GB |
| `medium` | 4 | 4 | 6 GB | 2 GB |
| `high` | 6 | 6 | 8 GB | 4 GB |
| `custom` | sesuai input | sesuai input | sesuai input | sesuai input |

**Contoh Penggunaan:**

```python
import bribrain

# Menggunakan preset small (default)
spark = bribrain.sparkSession()

# Menggunakan preset medium
spark = bribrain.sparkSession(executor="medium")

# Menggunakan custom config
spark = bribrain.sparkSession(
    appname="My App",
    executor="custom",
    instances=4,
    cores=4,
    memory=8,
    overhead=4
)

# Menambahkan extra Spark config
spark = bribrain.sparkSession(
    extra_configs={
        "spark.sql.shuffle.partitions": "200",
        "spark.sql.adaptive.enabled": "true"
    }
)
```

**Return:** `pyspark.sql.session.SparkSession`

</details>

<details>
<summary><b><code>template()</code></b> — Membuat Template Foldering</summary>
<br>

Membuat template foldering yang digunakan sebagai standard untuk proses data engineering.

**Contoh Penggunaan:**

```python
import bribrain

bribrain.template()
```

> ⚠️ Fungsi ini akan mengunduh template dari HDFS dan mengekstraknya ke `/home/cdsw/`.

</details>

---

### 2. Function — Utility Functions

Modul yang berisi berbagai fungsi utilitas untuk mendukung proses data engineering.

<details>
<summary><b><code>try_or()</code></b> — Menangkap Error</summary>
<br>

Menangkap error dari suatu fungsi dan memberikan keluaran alternatif.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `func` | `function` | *required* | Python function (tambahkan `lambda` sebelum nama function) |
| `default` | `object` | `None` | Nilai keluaran jika terjadi error |
| `expected_exc` | `Exception` | `(Exception,)` | Tipe exception yang diharapkan |

**Contoh Penggunaan:**

```python
import bribrain

# Menangkap error dan mengembalikan default value
result = bribrain.try_or(lambda: int("abc"), default=0)
print(result)  # Output: 0

# Tanpa error
result = bribrain.try_or(lambda: int("123"), default=0)
print(result)  # Output: 123
```

**Return:** `object` — keluaran dari function atau default value jika terjadi error

</details>

<details>
<summary><b><code>set_timer()</code></b> — Menetapkan Waktu Awal</summary>
<br>

Menetapkan waktu awal untuk penghitungan durasi proses.

**Contoh Penggunaan:**

```python
import bribrain

bribrain.set_timer()
```

**Return:** `float` — waktu dalam format float

</details>

<details>
<summary><b><code>get_timer()</code></b> — Mendapatkan Durasi Proses</summary>
<br>

Mendapatkan durasi proses berdasarkan waktu awal dikurangi waktu sekarang.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `start_time` | `float` | `None` | Timestamp waktu awal (jika `None`, menggunakan `set_timer()`) |

**Contoh Penggunaan:**

```python
import bribrain

bribrain.set_timer()

# ... proses yang berjalan ...

duration = bribrain.get_timer()
print(duration)  # Output: "00:05:30"
```

**Return:** `string` — durasi proses dengan format `HH:MM:SS`

</details>

<details>
<summary><b><code>show_time()</code></b> — Menampilkan Waktu Saat Ini</summary>
<br>

Menampilkan waktu saat ini sesuai format yang diinginkan.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `format_time` | `str` | `"%Y-%m-%d %H:%M:%S"` | Format waktu |

**Contoh Penggunaan:**

```python
import bribrain

print(bribrain.show_time())
# Output: "2026-02-12 09:30:00"

print(bribrain.show_time("%d/%m/%Y"))
# Output: "12/02/2026"
```

**Return:** `string` — waktu saat ini sesuai format input

</details>

<details>
<summary><b><code>remove_blank_space()</code></b> — Menghapus Spasi Kosong pada Kolom</summary>
<br>

Menghapus spasi kosong pada kolom tertentu. Jika kolom hanya berisi spasi, akan diubah menjadi `None`.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `x` | `str` | *required* | Nama kolom yang akan dibersihkan |

**Contoh Penggunaan:**

```python
import bribrain
from pyspark.sql import functions as F

df = df.withColumn("nama", bribrain.remove_blank_space("nama"))
df.show()
```

**Return:** `pyspark.sql.functions.Column` — kolom dengan spasi kosong dihapus

</details>

<details>
<summary><b><code>cleanse_blank_space()</code></b> — Membersihkan Spasi pada Semua Kolom String</summary>
<br>

Membersihkan spasi kosong pada **semua kolom bertipe string** dalam DataFrame secara otomatis.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `df_to_clean` | `pyspark.sql.DataFrame` | *required* | DataFrame yang akan dibersihkan |

**Contoh Penggunaan:**

```python
import bribrain

# Sebelum: kolom string mungkin berisi "  " atau "  data  "
df_clean = bribrain.cleanse_blank_space(df)
df_clean.show()
# Sesudah: spasi di-trim, kolom yang hanya spasi menjadi None
```

**Return:** `pyspark.sql.DataFrame` — DataFrame dengan spasi kosong dihapus pada semua kolom string

</details>

<details>
<summary><b><code>lower_columns_name()</code></b> — Mengubah Nama Kolom Menjadi Huruf Kecil</summary>
<br>

Mengubah semua nama kolom dalam DataFrame menjadi huruf kecil.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `df` | `pyspark.sql.DataFrame` | *required* | DataFrame yang akan diubah |

**Contoh Penggunaan:**

```python
import bribrain

# Sebelum: kolom = ["Nama", "UMUR", "Alamat"]
df = bribrain.lower_columns_name(df)
print(df.columns)
# Sesudah: kolom = ["nama", "umur", "alamat"]
```

**Return:** `pyspark.sql.DataFrame` — DataFrame dengan nama kolom huruf kecil

</details>

<details>
<summary><b><code>pandas_to_spark()</code></b> — Konversi Pandas ke Spark DataFrame</summary>
<br>

Mengkonversi pandas DataFrame menjadi Spark DataFrame dengan schema otomatis.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `pdf` | `pandas.DataFrame` | *required* | DataFrame pandas yang akan dikonversi |
| `tz_to_utc` | `bool` | `True` | Konversi kolom datetime yang memiliki timezone ke UTC |

**Contoh Penggunaan:**

```python
import bribrain
import pandas as pd

pdf = pd.DataFrame({
    "nama": ["Andri", "Budi"],
    "umur": [28, 30]
})

spark_df = bribrain.pandas_to_spark(pdf)
spark_df.show()
```

**Return:** `pyspark.sql.DataFrame`

</details>

<details>
<summary><b><code>get_list_partition()</code></b> — Mendapatkan List Partisi</summary>
<br>

Memperoleh list partisi dari hive table yang diurutkan dari partisi terbaru.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `spark` | `SparkSession` | *required* | Spark session |
| `schema` | `str` | *required* | Nama schema dari table di Hive |
| `table` | `str` | *required* | Nama table di Hive |

**Contoh Penggunaan:**

```python
import bribrain

spark = bribrain.sparkSession()
partitions = bribrain.get_list_partition(spark, "my_schema", "my_table")
print(partitions)
# Output: [{'year': '2026', 'month': '02'}, {'year': '2026', 'month': '01'}, ...]
```

**Return:** `list` — list partisi diurutkan dari partisi terbaru

</details>

<details>
<summary><b><code>get_first_partition()</code></b> — Mendapatkan Partisi Pertama</summary>
<br>

Memperoleh partisi pertama dari hive table.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `spark` | `SparkSession` | *required* | Spark session |
| `schema` | `str` | *required* | Nama schema dari table di Hive |
| `table` | `str` | *required* | Nama table di Hive |

**Contoh Penggunaan:**

```python
import bribrain

spark = bribrain.sparkSession()
first = bribrain.get_first_partition(spark, "my_schema", "my_table")
print(first)
# Output: {'year': '2024', 'month': '01'}
```

**Return:** `dict` — partisi pertama

</details>

<details>
<summary><b><code>get_last_partition()</code></b> — Mendapatkan Partisi Terakhir</summary>
<br>

Memperoleh partisi terakhir dari hive table.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `spark` | `SparkSession` | *required* | Spark session |
| `schema` | `str` | *required* | Nama schema dari table di Hive |
| `table` | `str` | *required* | Nama table di Hive |

**Contoh Penggunaan:**

```python
import bribrain

spark = bribrain.sparkSession()
last = bribrain.get_last_partition(spark, "my_schema", "my_table")
print(last)
# Output: {'year': '2026', 'month': '02'}
```

**Return:** `dict` — partisi terakhir

</details>

<details>
<summary><b><code>check_partition_exists()</code></b> — Mengecek Keberadaan Partisi</summary>
<br>

Mengecek keberadaan partisi pada tabel HDFS dan mengembalikan metadata partisi terkait.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `spark` | `SparkSession` | *required* | Spark session |
| `target_value` | `str` | *required* | Nilai partisi yang dicari |
| `schema` | `str` | *required* | Nama schema dari table di Hive |
| `table` | `str` | *required* | Nama table di Hive |
| `mode` | `str` | `None` | Mode pengecekan |

**Contoh Penggunaan:**

```python
import bribrain

spark = bribrain.sparkSession()
result = bribrain.check_partition_exists(spark, "2026-02", "my_schema", "my_table")

if result:
    print("Partisi ditemukan:", result)
else:
    print("Partisi tidak ditemukan")
```

**Return:** `dict | None` — detail kolom partisi atau `None` jika tidak ditemukan

</details>

<details>
<summary><b><code>put_to_bridrive()</code></b> — Upload File ke BRIDrive</summary>
<br>

Mengirimkan file dari CDSW ke BRIDrive (Seafile).

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `file_path` | `str` | *required* | Path file yang akan di upload |
| `upload_url` | `str` | *required* | Upload link dari Seafile (BRIDrive) |

**Contoh Penggunaan:**

```python
import bribrain

bribrain.put_to_bridrive(
    file_path="resources/excel/report.xlsx",
    upload_url="https://bridrive.example.com/upload-link"
)
```

</details>

<details>
<summary><b><code>put_to_hdfs()</code></b> — Upload File ke HDFS</summary>
<br>

Mengirimkan file dari CDSW ke HDFS.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `file_path` | `str` | *required* | Path file yang akan di upload |
| `hdfs_path` | `str` | `"/tmp/development/bribrain"` | Path lokasi penyimpanan di HDFS |

**Contoh Penggunaan:**

```python
import bribrain

bribrain.put_to_hdfs("resources/csv/data.csv")

# Dengan custom path
bribrain.put_to_hdfs("resources/csv/data.csv", hdfs_path="/tmp/my_project")
```

</details>

<details>
<summary><b><code>get_from_hdfs()</code></b> — Download File dari HDFS</summary>
<br>

Mengambil file dari HDFS ke CDSW.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `file_path` | `str` | *required* | Path file di HDFS yang akan dipindahkan |
| `cdsw_path` | `str` | `"/home/cdsw/"` | Path penyimpanan file di CDSW |

**Contoh Penggunaan:**

```python
import bribrain

bribrain.get_from_hdfs("/tmp/development/bribrain/data.csv")

# Dengan custom CDSW path
bribrain.get_from_hdfs("/tmp/data.csv", cdsw_path="/home/cdsw/data/")
```

</details>

<details>
<summary><b><code>list_file_hdfs()</code></b> — Menampilkan List File di HDFS</summary>
<br>

Memperlihatkan list file yang ada pada lokasi HDFS.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `hdfs_path` | `str` | `"/user/{username}/"` | Path HDFS yang ingin ditampilkan |

**Contoh Penggunaan:**

```python
import bribrain

# Menampilkan file di direktori user default
bribrain.list_file_hdfs()

# Menampilkan file di path tertentu
bribrain.list_file_hdfs("/tmp/development/bribrain")
```

</details>

---

### 3. Ingestion — Standard Ingestion ke Hive

Modul orchestrator untuk proses standard ingestion data ke Hive.

<details>
<summary><b><code>ingest_to_hive()</code></b> — Orchestrator Ingestion</summary>
<br>

Orchestrator untuk proses standard ingestion data ke Hive. Mengatur seluruh alur ingestion mulai dari validasi, penambahan kolom partisi, penulisan data, hingga pencatatan metadata.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `spark` | `SparkSession` | *required* | Spark session |
| `params` | `dict` | *required* | Parameter pendukung dalam bentuk dictionary |

**Contoh Penggunaan:**

```python
import bribrain

spark = bribrain.sparkSession()

params = {
    "schema": "my_schema",
    "table": "my_table",
    "partition": "year|month",
    "mode": "append",
    # parameter lainnya sesuai kebutuhan
}

result = bribrain.ingest_to_hive(spark, params)
```

**Return:** `dict` — parameter hasil yang disimpan dalam bentuk dictionary

</details>

---

### 4. Load — Penulisan Data ke Berbagai Target

Modul untuk menulis/menyimpan data ke berbagai target: Hive, HDFS (CSV/Parquet/JSON/Excel), PostgreSQL, dan MySQL.

#### 📂 Hive

<details>
<summary><b><code>load_to_hive()</code></b> — Menulis DataFrame ke Hive</summary>
<br>

Melakukan penulisan PySpark DataFrame sebagai tabel Hive di HDFS.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `spark` | `SparkSession` | *required* | Spark session |
| `df` | `DataFrame` | *required* | PySpark DataFrame |
| `schema` | `str` | *required* | Target schema di HDFS |
| `table` | `str` | *required* | Target table di HDFS |
| `partition` | `str` | `None` | Kolom partisi (pisahkan dengan `\|` jika lebih dari satu) |
| `mode` | `str` | `"append"` | Mode penulisan (`append`, `overwrite`, `error`, `ignore`) |
| `repartition_number` | `int \| None` | `None` | Jumlah file parquet per partisi |
| `blocksize` | `int \| None` | `256` | Ukuran per file dalam MB (`64`, `128`, `256`, `512`, `None`) |
| `modified_date` | `bool` | `True` | Menambahkan kolom `modified_date` |
| `schema_temp` | `str` | `"sharingvision"` | Schema untuk temp table |
| `count` | `bool` | `False` | Menampilkan count data tersimpan |

**Contoh Penggunaan:**

```python
import bribrain

spark = bribrain.sparkSession()

# Penulisan sederhana (append)
bribrain.load_to_hive(spark, df, schema="my_schema", table="my_table")

# Penulisan dengan partisi
bribrain.load_to_hive(
    spark, df,
    schema="my_schema",
    table="my_table",
    partition="year|month",
    mode="overwrite",
    count=True
)

# Penulisan tanpa modified_date
bribrain.load_to_hive(
    spark, df,
    schema="my_schema",
    table="my_table",
    modified_date=False,
    blocksize=128
)
```

**Return:** `int | None` — total record jika `count=True`, `None` jika tidak

</details>

#### 📂 HDFS File

<details>
<summary><b><code>load_to_file()</code></b> — Menulis DataFrame ke HDFS (CSV/Parquet/JSON/Excel)</summary>
<br>

Melakukan penulisan PySpark DataFrame ke HDFS dengan format file tertentu.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `df` | `DataFrame` | *required* | PySpark DataFrame |
| `file_name` | `str` | *required* | HDFS path / nama file (tanpa ekstensi) |
| `file_type` | `str` | `"csv"` | Tipe file (`csv`, `parquet`, `json`, `excel`) |
| `repartition_number` | `int` | `1` | Jumlah file hasil |
| `delimiter` | `str` | `","` | Pemisah antar kolom (untuk CSV) |
| `download` | `bool` | `True` | Download ke local CML |
| `delete_hdfs_file` | `bool` | `True` | Hapus file di HDFS setelah download |

**Contoh Penggunaan:**

```python
import bribrain

# Menulis ke CSV
bribrain.load_to_file(df, "my_report", file_type="csv")

# Menulis ke CSV dengan delimiter tab
bribrain.load_to_file(df, "my_report", file_type="csv", delimiter="\t")

# Menulis ke Parquet
bribrain.load_to_file(df, "my_data", file_type="parquet")

# Menulis ke JSON
bribrain.load_to_file(df, "my_data", file_type="json")

# Menulis ke Excel
bribrain.load_to_file(df, "my_report", file_type="excel")

# Tanpa download ke local
bribrain.load_to_file(df, "my_report", file_type="csv", download=False)
```

</details>

<details>
<summary><b><code>download_hdfs_file()</code></b> — Download File dari HDFS</summary>
<br>

Mengunduh semua file partisi HDFS dari direktori user ke lokal dan melakukan pembersihan opsional.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `file_name` | `str` | *required* | Nama file/direktori target di HDFS |
| `file_type` | `str` | *required* | Tipe file (`csv`, `parquet`, `json`, `excel`) |
| `delete_hdfs_file` | `bool` | `False` | Hapus direktori di HDFS setelah download |

**Contoh Penggunaan:**

```python
from bribrain.load import download_hdfs_file

download_hdfs_file("my_report", "csv", delete_hdfs_file=True)
```

**Return:** `list[str]` — daftar path file lokal yang berhasil diunduh

</details>

<details>
<summary><b><code>load_to_excel()</code></b> — Menulis DataFrame ke Excel (Multi-Sheet)</summary>
<br>

Melakukan penulisan PySpark DataFrame ke HDFS dengan format Excel. Mendukung **multi-sheet** — Anda dapat menulis beberapa DataFrame sekaligus sebagai sheet terpisah dalam satu file Excel.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `df` | `DataFrame \| list[DataFrame]` | *required* | Satu DataFrame atau list DataFrame |
| `file_name` | `str` | *required* | HDFS path / nama file (tanpa ekstensi) |
| `sheet_name` | `str \| list[str] \| None` | `None` | Nama sheet atau list nama sheet |
| `download` | `bool` | `True` | Download ke local CML |
| `delete_hdfs_file` | `bool` | `True` | Hapus file di HDFS setelah download |

**Aturan `sheet_name`:**
- `None` → sheet diberi nama otomatis: `Sheet1`, `Sheet2`, dst.
- `str` → hanya berlaku untuk satu DataFrame
- `list[str]` → jumlah harus sama dengan jumlah DataFrame

**Contoh Penggunaan:**

```python
import bribrain

# Single DataFrame (backward compatible)
bribrain.load_to_excel(df, "my_report")

# Single DataFrame dengan custom sheet name
bribrain.load_to_excel(df, "my_report", sheet_name="Summary")

# Multiple DataFrame dengan custom sheet name
bribrain.load_to_excel(
    [df_revenue, df_cost, df_profit],
    "financial_report",
    sheet_name=["Revenue", "Cost", "Profit"]
)

# Multiple DataFrame dengan auto naming
bribrain.load_to_excel(
    [df1, df2],
    "my_report"
)
# Hasil sheet: Sheet1, Sheet2
```

</details>

#### 🐘 PostgreSQL

<details>
<summary><b><code>load_to_postgresql()</code></b> — Menulis DataFrame ke PostgreSQL</summary>
<br>

Melakukan penulisan PySpark DataFrame sebagai tabel di PostgreSQL.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `df` | `DataFrame` | *required* | PySpark DataFrame |
| `database` | `str` | *required* | Target database |
| `schema` | `str` | *required* | Target schema |
| `table` | `str` | *required* | Target table |
| `ip` | `str` | *required* | Target IP |
| `port` | `str` | *required* | Target port |
| `username` | `str` | *required* | Username |
| `password` | `str` | *required* | Password |
| `mode` | `str` | `"append"` | Mode penulisan (`append`, `overwrite`, `error`, `ignore`) |
| `strategy` | `str` | `None` | Proses sebelum penulisan (`truncate`, `drop`, `None`) |
| `ddl` | `str` | `None` | Query CREATE TABLE |
| `count` | `bool` | `True` | Menampilkan count data tersimpan |

**Contoh Penggunaan:**

```python
import bribrain

# Append data
bribrain.load_to_postgresql(
    df,
    database="mydb",
    schema="public",
    table="my_table",
    ip="192.168.1.100",
    port="5432",
    username="admin",
    password="secret"
)

# Truncate lalu insert
bribrain.load_to_postgresql(
    df,
    database="mydb",
    schema="public",
    table="my_table",
    ip="192.168.1.100",
    port="5432",
    username="admin",
    password="secret",
    strategy="truncate"
)

# Drop lalu create ulang dengan DDL
bribrain.load_to_postgresql(
    df,
    database="mydb",
    schema="public",
    table="my_table",
    ip="192.168.1.100",
    port="5432",
    username="admin",
    password="secret",
    strategy="drop",
    ddl="""
        CREATE TABLE public.my_table (
            id SERIAL PRIMARY KEY,
            name VARCHAR(100),
            value NUMERIC
        )
    """
)
```

</details>

<details>
<summary><b><code>postgresql_execute_command()</code></b> — Menjalankan Query di PostgreSQL</summary>
<br>

Menjalankan query (non-SELECT) di PostgreSQL.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `database` | `str` | *required* | Target database |
| `ip` | `str` | *required* | Target IP |
| `port` | `str` | *required* | Target port |
| `username` | `str` | *required* | Username |
| `password` | `str` | *required* | Password |
| `query` | `str` | *required* | Query yang akan dieksekusi |

**Contoh Penggunaan:**

```python
import bribrain

bribrain.postgresql_execute_command(
    database="mydb",
    ip="192.168.1.100",
    port="5432",
    username="admin",
    password="secret",
    query="UPDATE public.my_table SET status = 'active' WHERE id = 1"
)
```

</details>

<details>
<summary><b><code>postgresql_execute_fetchall()</code></b> — Query Select di PostgreSQL</summary>
<br>

Menjalankan query SELECT di PostgreSQL dan mengembalikan hasilnya.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `database` | `str` | *required* | Target database |
| `ip` | `str` | *required* | Target IP |
| `port` | `str` | *required* | Target port |
| `username` | `str` | *required* | Username |
| `password` | `str` | *required* | Password |
| `query` | `str` | *required* | Query yang akan dieksekusi |

**Contoh Penggunaan:**

```python
import bribrain

rows = bribrain.postgresql_execute_fetchall(
    database="mydb",
    ip="192.168.1.100",
    port="5432",
    username="admin",
    password="secret",
    query="SELECT * FROM public.my_table LIMIT 10"
)

for row in rows:
    print(row)
```

**Return:** `list` — data keluaran dari query

</details>

<details>
<summary><b><code>postgresql_drop_table()</code></b> — Drop Table di PostgreSQL</summary>
<br>

Menghapus tabel di PostgreSQL.

**Contoh Penggunaan:**

```python
import bribrain

bribrain.postgresql_drop_table(
    database="mydb",
    schema="public",
    table="my_table",
    ip="192.168.1.100",
    port="5432",
    username="admin",
    password="secret"
)
```

</details>

<details>
<summary><b><code>postgresql_truncate_table()</code></b> — Truncate Table di PostgreSQL</summary>
<br>

Mengosongkan data tabel di PostgreSQL (tanpa menghapus strukturnya).

**Contoh Penggunaan:**

```python
import bribrain

bribrain.postgresql_truncate_table(
    database="mydb",
    schema="public",
    table="my_table",
    ip="192.168.1.100",
    port="5432",
    username="admin",
    password="secret"
)
```

</details>

#### 🐬 MySQL

<details>
<summary><b><code>load_to_mysql()</code></b> — Menulis DataFrame ke MySQL</summary>
<br>

Melakukan penulisan PySpark DataFrame sebagai tabel di MySQL.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `df` | `DataFrame` | *required* | PySpark DataFrame |
| `schema` | `str` | *required* | Target schema |
| `table` | `str` | *required* | Target table |
| `ip` | `str` | *required* | Target IP |
| `port` | `str` | *required* | Target port |
| `username` | `str` | *required* | Username |
| `password` | `str` | *required* | Password |
| `mode` | `str` | `"append"` | Mode penulisan (`append`, `overwrite`, `error`, `ignore`) |
| `strategy` | `str` | `None` | Proses sebelum penulisan (`truncate`, `drop`, `None`) |
| `ddl` | `str` | `None` | Query CREATE TABLE |
| `count` | `bool` | `True` | Menampilkan count data tersimpan |

**Contoh Penggunaan:**

```python
import bribrain

bribrain.load_to_mysql(
    df,
    schema="my_database",
    table="my_table",
    ip="192.168.1.100",
    port="3306",
    username="admin",
    password="secret",
    mode="append"
)

# Dengan strategy truncate
bribrain.load_to_mysql(
    df,
    schema="my_database",
    table="my_table",
    ip="192.168.1.100",
    port="3306",
    username="admin",
    password="secret",
    strategy="truncate"
)
```

</details>

<details>
<summary><b><code>mysql_execute_command()</code></b> — Menjalankan Query di MySQL</summary>
<br>

Menjalankan query (non-SELECT) di MySQL.

**Contoh Penggunaan:**

```python
import bribrain

bribrain.mysql_execute_command(
    schema="my_database",
    ip="192.168.1.100",
    port="3306",
    username="admin",
    password="secret",
    query="UPDATE my_table SET status = 'done' WHERE id = 1"
)
```

</details>

<details>
<summary><b><code>mysql_execute_fetchall()</code></b> — Query Select di MySQL</summary>
<br>

Menjalankan query SELECT di MySQL dan mengembalikan hasilnya.

**Contoh Penggunaan:**

```python
import bribrain

rows = bribrain.mysql_execute_fetchall(
    schema="my_database",
    ip="192.168.1.100",
    port="3306",
    username="admin",
    password="secret",
    query="SELECT * FROM my_table LIMIT 10"
)

for row in rows:
    print(row)
```

**Return:** `list` — data keluaran dari query

</details>

<details>
<summary><b><code>mysql_drop_table()</code></b> — Drop Table di MySQL</summary>
<br>

Menghapus tabel di MySQL.

**Contoh Penggunaan:**

```python
import bribrain

bribrain.mysql_drop_table(
    schema="my_database",
    table="my_table",
    ip="192.168.1.100",
    port="3306",
    username="admin",
    password="secret"
)
```

</details>

<details>
<summary><b><code>mysql_truncate_table()</code></b> — Truncate Table di MySQL</summary>
<br>

Mengosongkan data tabel di MySQL.

**Contoh Penggunaan:**

```python
import bribrain

bribrain.mysql_truncate_table(
    schema="my_database",
    table="my_table",
    ip="192.168.1.100",
    port="3306",
    username="admin",
    password="secret"
)
```

</details>

---

### 5. Metadata — Informasi Environment

Modul untuk mengambil informasi metadata dari environment variable.

<details>
<summary><b><code>get_userid()</code></b> — Mendapatkan User ID</summary>
<br>

Mengambil Hadoop user ID dari environment variable `HADOOP_USER_NAME`.

**Contoh Penggunaan:**

```python
import bribrain

user_id = bribrain.get_userid()
print(user_id)  # Output: "bribrain_sac"
```

**Return:** `str`

</details>

<details>
<summary><b><code>get_username()</code></b> — Mendapatkan Username</summary>
<br>

Menghasilkan nama lengkap berdasarkan Git author email. Nama dibentuk dari bagian local email (sebelum `@`).

**Contoh Penggunaan:**

```python
import bribrain

username = bribrain.get_username()
print(username)  # Output: "Andri Ariyanto"
```

**Return:** `str`

</details>

<details>
<summary><b><code>get_email()</code></b> — Mendapatkan Email</summary>
<br>

Mengambil Git author email dari environment variable `GIT_AUTHOR_EMAIL`.

**Contoh Penggunaan:**

```python
import bribrain

email = bribrain.get_email()
print(email)  # Output: "user@example.com"
```

**Return:** `str`

</details>

<details>
<summary><b><code>get_project_url()</code></b> — Mendapatkan Project URL</summary>
<br>

Mengambil URL project dari environment variable `CDSW_PROJECT_URL`.

```python
import bribrain

url = bribrain.get_project_url()
print(url)
```

**Return:** `str`

</details>

<details>
<summary><b><code>get_project_id()</code></b> — Mendapatkan Project ID</summary>
<br>

Mengambil ID project dari environment variable `CDSW_PROJECT_ID`.

```python
import bribrain

project_id = bribrain.get_project_id()
print(project_id)
```

**Return:** `str`

</details>

<details>
<summary><b><code>get_project_num()</code></b> — Mendapatkan Project Number</summary>
<br>

Mengambil nomor project dari environment variable `CDSW_PROJECT_NUM`.

```python
import bribrain

project_num = bribrain.get_project_num()
print(project_num)
```

**Return:** `str`

</details>

<details>
<summary><b><code>get_project_name()</code></b> — Mendapatkan Nama Project</summary>
<br>

Membentuk nama project dengan format yang dapat disesuaikan.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `env` | `str \| None` | `None` | Environment (`None`, `"dev"`, `"prod"`) |
| `case` | `str \| None` | `None` | Format huruf (`None`, `"lower"`, `"upper"`) |
| `delimiter` | `str \| None` | `"_"` | Karakter pemisah (menggantikan `-`) |

**Contoh Penggunaan:**

```python
import bribrain

# Default
print(bribrain.get_project_name())
# Output: "bribrain_pipeline"

# Dengan environment dan uppercase
print(bribrain.get_project_name(env="dev", case="upper"))
# Output: "DEV_BRIBRAIN_PIPELINE"

# Mempertahankan delimiter asli
print(bribrain.get_project_name(delimiter=None))
# Output: "dev-bribrain-pipeline"
```

**Return:** `str`

</details>

<details>
<summary><b><code>get_proxy()</code></b> — Mendapatkan Konfigurasi Proxy</summary>
<br>

Mengambil konfigurasi proxy HTTP dan HTTPS dari environment variable.

**Contoh Penggunaan:**

```python
import bribrain

proxies = bribrain.get_proxy()
print(proxies)
# Output: {"http": "http://proxy.company.com:8080", "https": "https://proxy.company.com:8080"}
```

**Return:** `dict`

</details>

---

### 6. Notification — Notifikasi Telegram

Modul untuk mengirim pesan, gambar, dan file ke Telegram via Bot API.

<details>
<summary><b><code>send_message_telegram()</code></b> — Kirim Pesan Teks</summary>
<br>

Mengirim pesan teks ke Telegram. Otomatis membagi pesan panjang menjadi beberapa bagian jika melebihi batas 4096 karakter.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `message` | `str` | *required* | Pesan yang akan dikirim |
| `bot_token` | `str` | *required* | Token bot Telegram |
| `chat_id` | `str \| int` | *required* | Chat ID tujuan |
| `parse_mode` | `str` | `"HTML"` | Mode parsing (`HTML`, `Markdown`) |
| `disable_web_page_preview` | `bool` | `True` | Nonaktifkan preview link |
| `proxies` | `dict` | `None` | Konfigurasi proxy |
| `timeout` | `int` | `20` | Request timeout (detik) |
| `max_len` | `int` | `4096` | Panjang maksimum per pesan |

**Contoh Penggunaan:**

```python
import bribrain

BOT_TOKEN = "your-bot-token"
CHAT_ID = "-100123456789"

# Kirim pesan sederhana
bribrain.send_message_telegram(
    message="✅ Proses ETL selesai!",
    bot_token=BOT_TOKEN,
    chat_id=CHAT_ID
)

# Kirim pesan dengan HTML formatting
bribrain.send_message_telegram(
    message="<b>Status:</b> Sukses\n<i>Durasi:</i> 5 menit",
    bot_token=BOT_TOKEN,
    chat_id=CHAT_ID
)

# Menggunakan proxy
proxies = bribrain.get_proxy()
bribrain.send_message_telegram(
    message="Pesan dengan proxy",
    bot_token=BOT_TOKEN,
    chat_id=CHAT_ID,
    proxies=proxies
)
```

</details>

<details>
<summary><b><code>send_image_telegram()</code></b> — Kirim Gambar</summary>
<br>

Mengirim gambar ke Telegram. Mendukung pengiriman dari file lokal maupun gambar hasil generate di memory (bytes / BytesIO).

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `bot_token` | `str` | *required* | Token bot Telegram |
| `chat_id` | `str \| int` | *required* | Chat ID tujuan |
| `image` | `str \| bytes \| BytesIO` | *required* | Path file gambar atau objek gambar |
| `caption` | `str` | `None` | Caption gambar |
| `parse_mode` | `str` | `"HTML"` | Mode parsing |
| `filename` | `str` | `"image.png"` | Nama file gambar |
| `proxies` | `dict` | `None` | Konfigurasi proxy |
| `timeout` | `int` | `60` | Request timeout (detik) |

**Contoh Penggunaan:**

```python
import bribrain

BOT_TOKEN = "your-bot-token"
CHAT_ID = "-100123456789"

# Kirim gambar dari file lokal
bribrain.send_image_telegram(
    bot_token=BOT_TOKEN,
    chat_id=CHAT_ID,
    image="resources/chart.png",
    caption="📊 Grafik penjualan bulan ini"
)

# Kirim gambar dari BytesIO
import io
img_buffer = io.BytesIO(image_bytes)
bribrain.send_image_telegram(
    bot_token=BOT_TOKEN,
    chat_id=CHAT_ID,
    image=img_buffer,
    caption="Generated chart"
)
```

</details>

<details>
<summary><b><code>send_file_telegram()</code></b> — Kirim File/Dokumen</summary>
<br>

Mengirim file atau dokumen ke Telegram. Cocok untuk mengirim report, log, CSV, Excel, atau file hasil generate lainnya.

**Parameter:**

| Parameter | Tipe | Default | Deskripsi |
|---|---|---|---|
| `bot_token` | `str` | *required* | Token bot Telegram |
| `chat_id` | `str \| int` | *required* | Chat ID tujuan |
| `file_obj` | `str \| bytes \| BytesIO` | *required* | Path file atau objek file |
| `filename` | `str` | *required* | Nama file |
| `caption` | `str` | `None` | Caption file |
| `parse_mode` | `str` | `"HTML"` | Mode parsing |
| `proxies` | `dict` | `None` | Konfigurasi proxy |
| `timeout` | `int` | `120` | Request timeout (detik) |

**Contoh Penggunaan:**

```python
import bribrain

BOT_TOKEN = "your-bot-token"
CHAT_ID = "-100123456789"

# Kirim file Excel
bribrain.send_file_telegram(
    bot_token=BOT_TOKEN,
    chat_id=CHAT_ID,
    file_obj="resources/excel/report.xlsx",
    filename="report.xlsx",
    caption="📄 Laporan bulanan"
)

# Kirim file CSV
bribrain.send_file_telegram(
    bot_token=BOT_TOKEN,
    chat_id=CHAT_ID,
    file_obj="resources/csv/data.csv",
    filename="data.csv"
)
```

</details>

---

## 📦 Dependencies

| Package | Versi |
|---|---|
| `mysql-connector-python` | `8.0.28` |
| `psycopg2` | latest |
| `openpyxl` | latest |
| `pyspark` | (environment) |
| `pandas` | (environment) |
| `requests` | (environment) |

---

## 👨‍💻 Author

**Andri Ariyanto**
- 📧 Email: ariyant.andri@gmail.com
- 🏢 BRIBrain AI Engineer Team

---

## 📄 License

```
Copyright © Andri Ariyanto — AI Department - BRI
```
