ಸರಿ, ನೀವು "AI" ಅನ್ನು ನಿರ್ಮಿಸುವ ಬಗ್ಗೆ ಕುತೂಹಲ ಹೊಂದಿದ್ದೀರಿ. ಹಾಲಿವುಡ್ ಅರ್ಥದಲ್ಲಿ ಅದು ಅಸ್ತಿತ್ವವನ್ನು ಚಿಂತಿಸುವುದಿಲ್ಲ, ಆದರೆ ನಿಮ್ಮ ಲ್ಯಾಪ್ಟಾಪ್ನಲ್ಲಿ ನೀವು ಚಲಾಯಿಸಬಹುದಾದ ರೀತಿಯ ಭವಿಷ್ಯವಾಣಿಗಳನ್ನು ಮಾಡುವ, ವಿಷಯಗಳನ್ನು ವಿಂಗಡಿಸುವ, ಬಹುಶಃ ಸ್ವಲ್ಪ ಚಾಟ್ ಮಾಡುವ. ನಿಮ್ಮ ಕಂಪ್ಯೂಟರ್ನಲ್ಲಿ AI ಅನ್ನು ಹೇಗೆ ಮಾಡುವುದು ಶೂನ್ಯದಿಂದ ಸ್ಥಳೀಯವಾಗಿ ನಿಜವಾಗಿಯೂ ಕೆಲಸ ಮಾಡುವ ಯಾವುದನ್ನಾದರೂ ಎಳೆಯುವ ನನ್ನ ಪ್ರಯತ್ನವಾಗಿದೆ . ಶಾರ್ಟ್ಕಟ್ಗಳು, ಮೊಂಡಾದ ಅಭಿಪ್ರಾಯಗಳು ಮತ್ತು ಸಾಂದರ್ಭಿಕ ಅಡ್ಡದಾರಿಯನ್ನು ನಿರೀಕ್ಷಿಸಿ ಏಕೆಂದರೆ, ನಿಜವಾಗಲಿ, ಟಿಂಕರಿಂಗ್ ಎಂದಿಗೂ ಸ್ವಚ್ಛವಾಗಿರುವುದಿಲ್ಲ.
ಇದರ ನಂತರ ನೀವು ಓದಲು ಇಷ್ಟಪಡಬಹುದಾದ ಲೇಖನಗಳು:
🔗 AI ಮಾದರಿಯನ್ನು ಹೇಗೆ ಮಾಡುವುದು: ಪೂರ್ಣ ಹಂತಗಳನ್ನು ವಿವರಿಸಲಾಗಿದೆ
ಆರಂಭದಿಂದ ಅಂತ್ಯದವರೆಗೆ AI ಮಾದರಿ ರಚನೆಯ ಸ್ಪಷ್ಟ ವಿವರಣೆ.
🔗 ಸಾಂಕೇತಿಕ AI ಎಂದರೇನು: ನೀವು ತಿಳಿದುಕೊಳ್ಳಬೇಕಾದದ್ದು
ಸಾಂಕೇತಿಕ AI ಮೂಲಗಳು, ಇತಿಹಾಸ ಮತ್ತು ಆಧುನಿಕ-ದಿನದ ಅನ್ವಯಿಕೆಗಳನ್ನು ಕಲಿಯಿರಿ.
🔗 AI ಗಾಗಿ ಡೇಟಾ ಸಂಗ್ರಹಣೆ ಅವಶ್ಯಕತೆಗಳು: ನಿಮಗೆ ಬೇಕಾಗಿರುವುದು
ದಕ್ಷ ಮತ್ತು ಸ್ಕೇಲೆಬಲ್ AI ವ್ಯವಸ್ಥೆಗಳಿಗೆ ಶೇಖರಣಾ ಅಗತ್ಯಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಿ.
ಈಗ ಯಾಕೆ ತಲೆಕೆಡಿಸಿಕೊಳ್ಳಬೇಕು? 🧭
ಏಕೆಂದರೆ "ಗೂಗಲ್-ಸ್ಕೇಲ್ ಲ್ಯಾಬ್ಗಳು ಮಾತ್ರ AI ಮಾಡಬಹುದು" ಎಂಬ ಯುಗವು ಹೋಗಿದೆ. ಇತ್ತೀಚಿನ ದಿನಗಳಲ್ಲಿ, ಸಾಮಾನ್ಯ ಲ್ಯಾಪ್ಟಾಪ್, ಕೆಲವು ಓಪನ್-ಸೋರ್ಸ್ ಪರಿಕರಗಳು ಮತ್ತು ಹಠಮಾರಿತನದೊಂದಿಗೆ, ನೀವು ಇಮೇಲ್ಗಳನ್ನು ವರ್ಗೀಕರಿಸುವ, ಪಠ್ಯವನ್ನು ಸಂಕ್ಷೇಪಿಸುವ ಅಥವಾ ಚಿತ್ರಗಳನ್ನು ಟ್ಯಾಗ್ ಮಾಡುವ ಸಣ್ಣ ಮಾದರಿಗಳನ್ನು ಬೇಯಿಸಬಹುದು. ಯಾವುದೇ ಡೇಟಾ ಸೆಂಟರ್ ಅಗತ್ಯವಿಲ್ಲ. ನಿಮಗೆ ಬೇಕಾಗಿರುವುದು:
-
ಒಂದು ಯೋಜನೆ,
-
ಸ್ವಚ್ಛವಾದ ಸೆಟಪ್,
-
ಮತ್ತು ಯಂತ್ರವನ್ನು ಕಿಟಕಿಯಿಂದ ಹೊರಗೆ ಎಸೆಯಲು ಬಯಸದೆಯೇ ನೀವು ಮುಗಿಸಬಹುದಾದ ಗುರಿ.
ಇದನ್ನು ಅನುಸರಿಸಲು ಯೋಗ್ಯವಾಗಿಸುವುದು ಯಾವುದು ✅
"ನಿಮ್ಮ ಕಂಪ್ಯೂಟರ್ನಲ್ಲಿ AI ಅನ್ನು ಹೇಗೆ ರಚಿಸುವುದು" ಎಂದು ಕೇಳುವ ಜನರು ಸಾಮಾನ್ಯವಾಗಿ ಪಿಎಚ್ಡಿ ಬಯಸುವುದಿಲ್ಲ. ಅವರು ನಿಜವಾಗಿಯೂ ನಡೆಸಬಹುದಾದದ್ದನ್ನು ಬಯಸುತ್ತಾರೆ. ಒಳ್ಳೆಯ ಯೋಜನೆಯು ಕೆಲವು ವಿಷಯಗಳನ್ನು ವಿವರಿಸುತ್ತದೆ:
-
ಚಿಕ್ಕದಾಗಿ ಪ್ರಾರಂಭಿಸಿ : ಭಾವನೆಗಳನ್ನು ವರ್ಗೀಕರಿಸಿ, "ಬುದ್ಧಿವಂತಿಕೆಯನ್ನು ಪರಿಹರಿಸಿ" ಅಲ್ಲ.
-
ಪುನರುತ್ಪಾದನೆ :
ಕಾಂಡಾಅಥವಾವೆನ್ವಿಆದ್ದರಿಂದ ನೀವು ನಾಳೆ ಭಯವಿಲ್ಲದೆ ಪುನರ್ನಿರ್ಮಿಸಬಹುದು. -
ಹಾರ್ಡ್ವೇರ್ ಪ್ರಾಮಾಣಿಕತೆ : ಸೈಕಿಟ್-ಲರ್ನ್ಗೆ CPU ಗಳು ಉತ್ತಮ, ಆಳವಾದ ನೆಟ್ಗಳಿಗೆ GPU ಗಳು (ನೀವು ಅದೃಷ್ಟವಂತರಾಗಿದ್ದರೆ) [2][3].
-
ಡೇಟಾ ತೆರವುಗೊಳಿಸಿ : ತಪ್ಪಾಗಿ ಲೇಬಲ್ ಮಾಡಲಾದ ಜಂಕ್ ಇಲ್ಲ; ಯಾವಾಗಲೂ ರೈಲು/ಮಾನ್ಯ/ಪರೀಕ್ಷೆ ಎಂದು ವಿಭಜಿಸಲಾಗುತ್ತದೆ.
-
ಏನನ್ನಾದರೂ ಅರ್ಥೈಸುವ ಮೆಟ್ರಿಕ್ಗಳು : ನಿಖರತೆ, ನಿಖರತೆ, ಮರುಸ್ಥಾಪನೆ, F1. ಅಸಮತೋಲನಕ್ಕೆ, ROC-AUC/PR-AUC [1].
-
ಹಂಚಿಕೊಳ್ಳಲು ಒಂದು ಮಾರ್ಗ : ಒಂದು ಸಣ್ಣ API, CLI, ಅಥವಾ ಡೆಮೊ ಅಪ್ಲಿಕೇಶನ್.
-
ಸುರಕ್ಷತೆ : ಯಾವುದೇ ಅಸ್ಪಷ್ಟ ಡೇಟಾಸೆಟ್ಗಳಿಲ್ಲ, ಯಾವುದೇ ಖಾಸಗಿ ಮಾಹಿತಿ ಸೋರಿಕೆಯಿಲ್ಲ, ಅಪಾಯಗಳನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಗಮನಿಸಿ [4].
ಅವುಗಳನ್ನು ಸರಿಯಾಗಿ ಅರ್ಥಮಾಡಿಕೊಂಡರೆ, ನಿಮ್ಮ "ಸಣ್ಣ" ಮಾದರಿಯೂ ಸಹ ನಿಜವಾಗುತ್ತದೆ.
ಬೆದರಿಸುವಂತೆ ಕಾಣದ ಮಾರ್ಗಸೂಚಿ 🗺️
-
ಒಂದು ಸಣ್ಣ ಸಮಸ್ಯೆ + ಒಂದು ಮೆಟ್ರಿಕ್ ಆರಿಸಿ.
-
ಪೈಥಾನ್ ಮತ್ತು ಕೆಲವು ಪ್ರಮುಖ ಲೈಬ್ರರಿಗಳನ್ನು ಸ್ಥಾಪಿಸಿ.
-
ಸ್ವಚ್ಛ ವಾತಾವರಣವನ್ನು ಸೃಷ್ಟಿಸಿ (ನಂತರ ನೀವೇ ಧನ್ಯವಾದ ಹೇಳಿಕೊಳ್ಳುತ್ತೀರಿ).
-
ನಿಮ್ಮ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಲೋಡ್ ಮಾಡಿ, ಸರಿಯಾಗಿ ವಿಭಜಿಸಿ.
-
ಮೂರ್ಖ ಆದರೆ ಪ್ರಾಮಾಣಿಕವಾದ ಮೂಲ ತತ್ವಕ್ಕೆ ತರಬೇತಿ ನೀಡಿ.
-
ಅದು ಮೌಲ್ಯವನ್ನು ಸೇರಿಸಿದರೆ ಮಾತ್ರ ನರಮಂಡಲವನ್ನು ಪ್ರಯತ್ನಿಸಿ.
-
ಡೆಮೋ ಪ್ಯಾಕೇಜ್ ಮಾಡಿ.
-
ಕೆಲವು ಟಿಪ್ಪಣಿಗಳನ್ನು ಇಟ್ಟುಕೊಳ್ಳಿ, ಭವಿಷ್ಯದಲ್ಲಿ - ನೀವು ನಿಮಗೆ ಧನ್ಯವಾದ ಹೇಳುತ್ತೀರಿ.
ಕನಿಷ್ಠ ಕಿಟ್: ಹೆಚ್ಚು ಜಟಿಲಗೊಳಿಸಬೇಡಿ 🧰
-
ಪೈಥಾನ್ : python.org ನಿಂದ ಪಡೆದುಕೊಳ್ಳಿ.
-
ಪರಿಸರ ಪಿಪ್ನೊಂದಿಗೆ ಕಾಂಡಾ ಅಥವಾ
ವೆನ್ವ್ -
ನೋಟ್ಬುಕ್ಗಳು : ಆಟಕ್ಕಾಗಿ ಜುಪಿಟರ್.
-
ಸಂಪಾದಕ : VS ಕೋಡ್, ಸ್ನೇಹಪರ ಮತ್ತು ಶಕ್ತಿಶಾಲಿ.
-
ಕೋರ್ ಲಿಬ್ಸ್
-
ಪಾಂಡಾಗಳು + ನಂಬಿ (ಡೇಟಾ ಜಗಳ)
-
ಸೈಕಿಟ್-ಲರ್ನ್ (ಕ್ಲಾಸಿಕಲ್ ಎಂಎಲ್)
-
ಪೈಟಾರ್ಚ್ ಅಥವಾ ಟೆನ್ಸರ್ ಫ್ಲೋ (ಆಳವಾದ ಕಲಿಕೆ, ಜಿಪಿಯು ವಸ್ತುವನ್ನು ನಿರ್ಮಿಸುತ್ತದೆ) [2][3]
-
ಹಗ್ಗಿಂಗ್ ಫೇಸ್ ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳು, ಸ್ಪಾಸಿ, ಓಪನ್ಸಿವಿ (ಎನ್ಎಲ್ಪಿ + ವಿಷನ್)
-
-
ವೇಗವರ್ಧನೆ (ಐಚ್ಛಿಕ)
-
NVIDIA → CUDA ನಿರ್ಮಾಣಗಳು [2]
-
AMD → ROCm ನಿರ್ಮಾಣಗಳು [2]
-
ಆಪಲ್ → ಮೆಟಲ್ ಬ್ಯಾಕೆಂಡ್ (MPS) ಹೊಂದಿರುವ ಪೈಟಾರ್ಚ್ [2]
-
ನಿಮ್ಮ ಸೆಟಪ್ಗೆ ನಿಖರವಾದ ನೀಡಲು ನೀವು ಅನುಮತಿಸಿದರೆ ಹೆಚ್ಚಿನ "ಅನುಸ್ಥಾಪನಾ ನೋವು" ಮಾಯವಾಗುತ್ತದೆ
ಮುಖ್ಯ ನಿಯಮ: ಮೊದಲು CPU ನಲ್ಲಿ ಕ್ರಾಲ್ ಮಾಡಿ, ನಂತರ GPU ನೊಂದಿಗೆ ಸ್ಪ್ರಿಂಟ್ ಮಾಡಿ.
ನಿಮ್ಮ ರಾಶಿಯನ್ನು ಆರಿಸಿಕೊಳ್ಳಿ: ಹೊಳೆಯುವ ವಸ್ತುಗಳನ್ನು ವಿರೋಧಿಸಿ 🧪
-
ಕೋಷ್ಟಕ ದತ್ತಾಂಶ → ಸೈಕಿಟ್-ಲರ್ನ್. ಲಾಜಿಸ್ಟಿಕ್ ಹಿಂಜರಿತ, ಯಾದೃಚ್ಛಿಕ ಅರಣ್ಯಗಳು, ಗ್ರೇಡಿಯಂಟ್ ಬೂಸ್ಟಿಂಗ್.
-
ಪಠ್ಯ ಅಥವಾ ಚಿತ್ರಗಳು → ಪೈಟಾರ್ಚ್ ಅಥವಾ ಟೆನ್ಸರ್ ಫ್ಲೋ. ಪಠ್ಯಕ್ಕಾಗಿ, ಸಣ್ಣ ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ ಅನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡುವುದು ದೊಡ್ಡ ಗೆಲುವು.
-
Chatbot-ish →
llama.cppಲ್ಯಾಪ್ಟಾಪ್ಗಳಲ್ಲಿ ಸಣ್ಣ LLM ಗಳನ್ನು ಚಲಾಯಿಸಬಹುದು. ಮ್ಯಾಜಿಕ್ ಅನ್ನು ನಿರೀಕ್ಷಿಸಬೇಡಿ, ಆದರೆ ಇದು ಟಿಪ್ಪಣಿಗಳು ಮತ್ತು ಸಾರಾಂಶಗಳಿಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ [5].
ಸ್ವಚ್ಛ ಪರಿಸರ ಸೆಟಪ್ 🧼
# Conda way conda create -n Lokai python=3.11 conda activate Lokai # ಅಥವಾ venv python -m venv .venv ಮೂಲ .venv/bin/activate # Windows: .venv\Scripts\activate
ನಂತರ ಅಗತ್ಯ ವಸ್ತುಗಳನ್ನು ಸ್ಥಾಪಿಸಿ:
ಪಿಪ್ ಇನ್ಸ್ಟಾಲ್ ನಂಬಿ ಪಾಂಡಾಗಳು ಸೈಕಿಟ್-ಲರ್ನ್ ಜುಪಿಟರ್ ಪಿಪ್ ಇನ್ಸ್ಟಾಲ್ ಟಾರ್ಚ್ ಟಾರ್ಚ್ವಿಷನ್ ಟಾರ್ಚ್ಆಡಿಯೋ # ಅಥವಾ ಟೆನ್ಸರ್ಫ್ಲೋ ಪಿಪ್ ಇನ್ಸ್ಟಾಲ್ ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳ ಡೇಟಾಸೆಟ್ಗಳು
(GPU ಬಿಲ್ಡ್ಗಳಿಗೆ, ಗಂಭೀರವಾಗಿ, ಅಧಿಕೃತ ಸೆಲೆಕ್ಟರ್ ಅನ್ನು ಬಳಸಿ [2][3].)
ಮೊದಲು ಕೆಲಸ ಮಾಡುವ ಮಾದರಿ: ಅದನ್ನು ಚಿಕ್ಕದಾಗಿ ಇರಿಸಿ 🏁
ಮೊದಲು ಬೇಸ್ಲೈನ್. CSV → ವೈಶಿಷ್ಟ್ಯಗಳು + ಲೇಬಲ್ಗಳು → ಲಾಜಿಸ್ಟಿಕ್ ರಿಗ್ರೆಷನ್.
sklearn.linear_model ಇಂದ import LogisticRegression ... print("ನಿಖರತೆ:", accuracy_score(y_test, preds)) print(classification_report(y_test, preds))
ಇದು ಯಾದೃಚ್ಛಿಕಕ್ಕಿಂತ ಉತ್ತಮವಾಗಿದ್ದರೆ, ನೀವು ಆಚರಿಸಿ. ಕಾಫಿ ಅಥವಾ ಕುಕೀ, ನಿಮ್ಮ ಆಯ್ಕೆ ☕.
ಅಸಮತೋಲಿತ ತರಗತಿಗಳಿಗೆ, ಕಚ್ಚಾ ನಿಖರತೆಯ ಬದಲಿಗೆ ನಿಖರತೆ/ಮರುಸ್ಥಾಪನೆ + ROC/PR ವಕ್ರಾಕೃತಿಗಳನ್ನು ವೀಕ್ಷಿಸಿ [1].
ನರ ಜಾಲಗಳು (ಅವು ಸಹಾಯ ಮಾಡಿದರೆ ಮಾತ್ರ) 🧠
ಪಠ್ಯ ಸಿಕ್ಕಿದೆಯೇ ಮತ್ತು ಭಾವನೆಗಳ ವರ್ಗೀಕರಣ ಬೇಕೇ? ಮೊದಲೇ ತರಬೇತಿ ಪಡೆದ ಸಣ್ಣ ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ ಅನ್ನು ಉತ್ತಮವಾಗಿ ಟ್ಯೂನ್ ಮಾಡಿ. ತ್ವರಿತವಾಗಿ, ಅಚ್ಚುಕಟ್ಟಾಗಿ, ನಿಮ್ಮ ಯಂತ್ರವನ್ನು ಹುರಿಯುವುದಿಲ್ಲ.
ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳಿಂದ ಆಮದು ಆಟೋಮಾಡೆಲ್ಫಾರ್ಸೀಕ್ವೆನ್ಸ್ಕ್ಲಾಸಿಫಿಕೇಶನ್ ... trainer.train() print(trainer.evaluate())
ವೃತ್ತಿಪರ ಸಲಹೆ: ಸಣ್ಣ ಮಾದರಿಗಳೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ. 1% ಡೇಟಾದಲ್ಲಿ ಡೀಬಗ್ ಮಾಡುವುದರಿಂದ ಗಂಟೆಗಳನ್ನು ಉಳಿಸುತ್ತದೆ.
ಡೇಟಾ: ನೀವು ಬಿಟ್ಟುಬಿಡಲು ಸಾಧ್ಯವಾಗದ ಮೂಲಭೂತ ಅಂಶಗಳು 📦
-
ಸಾರ್ವಜನಿಕ ಡೇಟಾಸೆಟ್ಗಳು: ಕಾಗಲ್, ಹಗ್ಗಿಂಗ್ ಫೇಸ್, ಶೈಕ್ಷಣಿಕ ರೆಪೊಗಳು (ಪರವಾನಗಿಗಳನ್ನು ಪರಿಶೀಲಿಸಿ).
-
ನೀತಿಶಾಸ್ತ್ರ: ವೈಯಕ್ತಿಕ ಮಾಹಿತಿಯನ್ನು ಅಳಿಸಿಹಾಕಿ, ಹಕ್ಕುಗಳನ್ನು ಗೌರವಿಸಿ.
-
ವಿಭಜನೆಗಳು: ತರಬೇತಿ, ದೃಢೀಕರಣ, ಪರೀಕ್ಷೆ. ಎಂದಿಗೂ ಇಣುಕಬೇಡಿ.
-
ಲೇಬಲ್ಗಳು: ಅಲಂಕಾರಿಕ ಮಾದರಿಗಳಿಗಿಂತ ಸ್ಥಿರತೆ ಮುಖ್ಯ.
ಸತ್ಯ ಬಾಂಬ್: 60% ಫಲಿತಾಂಶಗಳು ವಾಸ್ತುಶಿಲ್ಪದ ಮಾಂತ್ರಿಕತೆಯಿಂದಲ್ಲ, ಬದಲಾಗಿ ಕ್ಲೀನ್ ಲೇಬಲ್ಗಳಿಂದ ಬಂದಿವೆ.
ನಿಮ್ಮನ್ನು ಪ್ರಾಮಾಣಿಕವಾಗಿಡುವ ಮಾಪನಗಳು 🎯
-
ವರ್ಗೀಕರಣ → ನಿಖರತೆ, ನಿಖರತೆ, ಮರುಸ್ಥಾಪನೆ, F1.
-
ಅಸಮತೋಲಿತ ಸೆಟ್ಗಳು → ROC-AUC, PR-AUC ಹೆಚ್ಚು ಮುಖ್ಯ.
-
ಹಿಂಜರಿತ → MAE, RMSE, R².
-
ರಿಯಾಲಿಟಿ ಚೆಕ್ → ಕೆಲವು ಔಟ್ಪುಟ್ಗಳನ್ನು ನೋಡಿ; ಸಂಖ್ಯೆಗಳು ಸುಳ್ಳಾಗಿರಬಹುದು.
ಉಪಯುಕ್ತ ಉಲ್ಲೇಖ: ಸೈಕಿಟ್-ಕಲಿಕೆ ಮೆಟ್ರಿಕ್ಸ್ ಮಾರ್ಗದರ್ಶಿ [1].
ವೇಗವರ್ಧನೆ ಸಲಹೆಗಳು 🚀
-
NVIDIA → PyTorch CUDA ಬಿಲ್ಡ್ [2]
-
ಎಎಮ್ಡಿ → ಆರ್ಒಸಿಎಂ [2]
-
ಆಪಲ್ → MPS ಬ್ಯಾಕೆಂಡ್ [2]
-
ಟೆನ್ಸರ್ಫ್ಲೋ → ಅಧಿಕೃತ GPU ಸ್ಥಾಪನೆಯನ್ನು ಅನುಸರಿಸಿ + ಪರಿಶೀಲಿಸಿ [3]
ಆದರೆ ನಿಮ್ಮ ಬೇಸ್ಲೈನ್ ಓಡುವ ಮೊದಲೇ ಆಪ್ಟಿಮೈಸ್ ಮಾಡಬೇಡಿ. ಅದು ಕಾರಿಗೆ ಚಕ್ರಗಳು ಬರುವ ಮೊದಲೇ ರಿಮ್ಗಳನ್ನು ಪಾಲಿಶ್ ಮಾಡಿದಂತೆ.
ಸ್ಥಳೀಯ ಉತ್ಪಾದಕ ಮಾದರಿಗಳು: ಮರಿ ಡ್ರ್ಯಾಗನ್ಗಳು 🐉
-
ಭಾಷೆ
llama.cppಮೂಲಕ ಕ್ವಾಂಟೈಸ್ಡ್ LLM ಗಳು [5]. ಟಿಪ್ಪಣಿಗಳು ಅಥವಾ ಕೋಡ್ ಸುಳಿವುಗಳಿಗೆ ಒಳ್ಳೆಯದು, ಆಳವಾದ ಸಂಭಾಷಣೆಗೆ ಅಲ್ಲ. -
ಚಿತ್ರಗಳು → ಸ್ಥಿರ ಪ್ರಸರಣ ರೂಪಾಂತರಗಳು ಅಸ್ತಿತ್ವದಲ್ಲಿವೆ; ಪರವಾನಗಿಗಳನ್ನು ಎಚ್ಚರಿಕೆಯಿಂದ ಓದಿ.
ಕೆಲವೊಮ್ಮೆ ಕಾರ್ಯ-ನಿರ್ದಿಷ್ಟ ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಲಾದ ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ ಸಣ್ಣ ಹಾರ್ಡ್ವೇರ್ನಲ್ಲಿ ಉಬ್ಬಿದ LLM ಅನ್ನು ಸೋಲಿಸುತ್ತದೆ.
ಪ್ಯಾಕೇಜಿಂಗ್ ಡೆಮೊಗಳು: ಜನರು ಕ್ಲಿಕ್ ಮಾಡಲಿ 🖥️
-
ಗ್ರೇಡಿಯೊ → ಸುಲಭವಾದ UI.
-
FastAPI → ಕ್ಲೀನ್ API.
-
ಫ್ಲಾಸ್ಕ್ → ತ್ವರಿತ ಲಿಪಿಗಳು.
gr clf = ಪೈಪ್ಲೈನ್("ಸೆಂಟಿಮೆಂಟ್-ವಿಶ್ಲೇಷಣೆ") ... demo.launch() ಎಂದು ಗ್ರ್ಯಾಡಿಯೊವನ್ನು ಆಮದು ಮಾಡಿ
ನಿಮ್ಮ ಬ್ರೌಸರ್ ಅದನ್ನು ತೋರಿಸಿದಾಗ ಅದು ಮ್ಯಾಜಿಕ್ನಂತೆ ಭಾಸವಾಗುತ್ತದೆ.
ಮಾನಸಿಕ ಸ್ವಾಸ್ಥ್ಯವನ್ನು ಉಳಿಸುವ ಅಭ್ಯಾಸಗಳು 🧠
-
ಆವೃತ್ತಿ ನಿಯಂತ್ರಣಕ್ಕಾಗಿ Git.
-
ಟ್ರ್ಯಾಕಿಂಗ್ ಪ್ರಯೋಗಗಳಿಗಾಗಿ MLflow ಅಥವಾ ನೋಟ್ಬುಕ್ಗಳು.
-
DVC ಅಥವಾ ಹ್ಯಾಶ್ಗಳೊಂದಿಗೆ ಡೇಟಾ ಆವೃತ್ತಿ.
-
ಇತರರು ನಿಮ್ಮ ವಸ್ತುಗಳನ್ನು ನಿರ್ವಹಿಸಬೇಕಾದರೆ ಡಾಕರ್.
-
ಪಿನ್ ಅವಲಂಬನೆಗಳು (
requirements.txt).
ನನ್ನನ್ನು ನಂಬಿರಿ, ಭವಿಷ್ಯ - ನೀವು ಕೃತಜ್ಞರಾಗಿರುತ್ತೀರಿ.
ಸಮಸ್ಯೆ ನಿವಾರಣೆ: ಸಾಮಾನ್ಯ "ಉಘ್" ಕ್ಷಣಗಳು 🧯
-
ದೋಷಗಳನ್ನು ಸ್ಥಾಪಿಸುವುದೇ? env ಅನ್ನು ಅಳಿಸಿ ಮತ್ತು ಮರುನಿರ್ಮಾಣ ಮಾಡಿ.
-
GPU ಪತ್ತೆಯಾಗಿಲ್ಲವೇ? ಚಾಲಕ ಹೊಂದಾಣಿಕೆಯಾಗುತ್ತಿಲ್ಲ, ಆವೃತ್ತಿಗಳನ್ನು ಪರಿಶೀಲಿಸಿ [2][3].
-
ಮಾದರಿ ಕಲಿಯುತ್ತಿಲ್ಲವೇ? ಕಡಿಮೆ ಕಲಿಕಾ ದರ, ಸರಳೀಕರಣ ಅಥವಾ ಲೇಬಲ್ಗಳನ್ನು ತೆರವುಗೊಳಿಸಿ.
-
ಅತಿಯಾಗಿ ಹೊಂದಿಕೊಳ್ಳುವುದೇ? ನಿಯಮಿತಗೊಳಿಸುವುದೇ, ಬಿಡುವುದೇ ಅಥವಾ ಹೆಚ್ಚಿನ ಡೇಟಾವನ್ನು ಬಳಸುವುದೇ?
-
ಮೆಟ್ರಿಕ್ಸ್ ತುಂಬಾ ಚೆನ್ನಾಗಿದೆಯೇ? ನೀವು ಪರೀಕ್ಷಾ ಸೆಟ್ ಅನ್ನು ಸೋರಿಕೆ ಮಾಡಿದ್ದೀರಿ (ನೀವು ಯೋಚಿಸುವುದಕ್ಕಿಂತ ಇದು ಹೆಚ್ಚು ಸಂಭವಿಸುತ್ತದೆ).
ಭದ್ರತೆ + ಜವಾಬ್ದಾರಿ 🛡️
-
ಸ್ಟ್ರಿಪ್ PII.
-
ಪರವಾನಗಿಗಳನ್ನು ಗೌರವಿಸಿ.
-
ಲೋಕಲ್-ಫಸ್ಟ್ = ಗೌಪ್ಯತೆ + ನಿಯಂತ್ರಣ, ಆದರೆ ಕಂಪ್ಯೂಟ್ ಮಿತಿಗಳೊಂದಿಗೆ.
-
ದಾಖಲೆ ಅಪಾಯಗಳು (ನ್ಯಾಯಯುತತೆ, ಸುರಕ್ಷತೆ, ಸ್ಥಿತಿಸ್ಥಾಪಕತ್ವ, ಇತ್ಯಾದಿ) [4].
ಉಪಯುಕ್ತ ಹೋಲಿಕೆ ಕೋಷ್ಟಕ 📊
| ಉಪಕರಣ | ಅತ್ಯುತ್ತಮವಾದದ್ದು | ಅದನ್ನು ಏಕೆ ಬಳಸಬೇಕು? |
|---|---|---|
| ಸೈಕಿಟ್-ಕಲಿಯಿರಿ | ಕೋಷ್ಟಕ ಡೇಟಾ | ತ್ವರಿತ ಗೆಲುವುಗಳು, ಕ್ಲೀನ್ API 🙂 |
| ಪೈಟಾರ್ಚ್ | ಕಸ್ಟಮ್ ಆಳವಾದ ಬಲೆಗಳು | ಹೊಂದಿಕೊಳ್ಳುವ, ದೊಡ್ಡ ಸಮುದಾಯ |
| ಟೆನ್ಸರ್ ಫ್ಲೋ | ಉತ್ಪಾದನಾ ಪೈಪ್ಲೈನ್ಗಳು | ಪರಿಸರ ವ್ಯವಸ್ಥೆ + ಸೇವೆ ಆಯ್ಕೆಗಳು |
| ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳು | ಪಠ್ಯ ಕಾರ್ಯಗಳು | ಪೂರ್ವ ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಗಳು ಕಂಪ್ಯೂಟ್ ಅನ್ನು ಉಳಿಸುತ್ತವೆ |
| ಸ್ಪಾಸಿ | NLP ಪೈಪ್ಲೈನ್ಗಳು | ಕೈಗಾರಿಕಾ ಶಕ್ತಿ, ಪ್ರಾಯೋಗಿಕ |
| ಗ್ರೇಡಿಯೊ | ಡೆಮೊಗಳು/UIಗಳು | 1 ಫೈಲ್ → UI |
| ಫಾಸ್ಟ್ಎಪಿಐ | API ಗಳು | ವೇಗ + ಆಟೋ ಡಾಕ್ಸ್ |
| ONNX ರನ್ಟೈಮ್ | ಅಡ್ಡ-ಚೌಕಟ್ಟಿನ ಬಳಕೆ | ಪೋರ್ಟಬಲ್ + ಪರಿಣಾಮಕಾರಿ |
| ಲಾಮಾ.ಸಿಪಿಪಿ | ಸಣ್ಣ ಸ್ಥಳೀಯ ಎಲ್ಎಲ್ಎಂಗಳು | CPU-ಸ್ನೇಹಿ ಕ್ವಾಂಟೀಕರಣ [5] |
| ಡಾಕರ್ | envs ಹಂಚಿಕೊಳ್ಳುವುದು | "ಇದು ಎಲ್ಲೆಡೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ" |
ಮೂರು ಆಳವಾದ ಡೈವ್ಗಳು (ನೀವು ನಿಜವಾಗಿಯೂ ಬಳಸುತ್ತೀರಿ) 🏊
-
ಕೋಷ್ಟಕಗಳಿಗೆ ವೈಶಿಷ್ಟ್ಯ ಎಂಜಿನಿಯರಿಂಗ್ → ಸಾಮಾನ್ಯೀಕರಿಸು, ಒಂದು-ಹಾಟ್, ಮರದ ಮಾದರಿಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿ, ಅಡ್ಡ-ಮೌಲ್ಯಮಾಪನ [1].
-
ಪಠ್ಯಕ್ಕಾಗಿ ಕಲಿಕೆಯನ್ನು ವರ್ಗಾಯಿಸಿ → ಸಣ್ಣ ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳನ್ನು ಸೂಕ್ಷ್ಮವಾಗಿ ಟ್ಯೂನ್ ಮಾಡಿ, ಅನುಕ್ರಮ ಉದ್ದವನ್ನು ಸಾಧಾರಣವಾಗಿ ಇರಿಸಿ, ಅಪರೂಪದ ತರಗತಿಗಳಿಗೆ F1 [1].
-
ಸ್ಥಳೀಯ ನಿರ್ಣಯಕ್ಕಾಗಿ ಆಪ್ಟಿಮೈಸೇಶನ್ → ಕ್ವಾಂಟೈಜ್ ಮಾಡಿ, ONNX ರಫ್ತು ಮಾಡಿ, ಟೋಕನೈಜರ್ಗಳನ್ನು ಸಂಗ್ರಹಿಸಿ.
ಕ್ಲಾಸಿಕ್ ಮೋಸಗಳು 🪤
-
ಕಟ್ಟಡ ತುಂಬಾ ದೊಡ್ಡದಾಗಿದೆ, ತುಂಬಾ ಬೇಗ.
-
ಡೇಟಾ ಗುಣಮಟ್ಟವನ್ನು ನಿರ್ಲಕ್ಷಿಸಲಾಗುತ್ತಿದೆ.
-
ಪರೀಕ್ಷಾ ವಿಭಜನೆಯನ್ನು ಬಿಟ್ಟುಬಿಡಲಾಗುತ್ತಿದೆ.
-
ಬ್ಲೈಂಡ್ ಕಾಪಿ-ಪೇಸ್ಟ್ ಕೋಡಿಂಗ್.
-
ಏನನ್ನೂ ದಾಖಲಿಸುತ್ತಿಲ್ಲ.
README ಕೂಡ ಗಂಟೆಗಳ ನಂತರವೂ ಉಳಿಸುತ್ತದೆ.
ಸಮಯಕ್ಕೆ ತಕ್ಕ ಕಲಿಕಾ ಸಂಪನ್ಮೂಲಗಳು 📚
-
ಅಧಿಕೃತ ದಾಖಲೆಗಳು (ಪೈಟಾರ್ಚ್, ಟೆನ್ಸರ್ಫ್ಲೋ, ಸ್ಕೈಕಿಟ್-ಲರ್ನ್, ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ಗಳು).
-
Google ML ಕ್ರ್ಯಾಶ್ ಕೋರ್ಸ್, DeepLearning.AI.
-
ದೃಷ್ಟಿಯ ಮೂಲಭೂತ ವಿಷಯಗಳಿಗಾಗಿ OpenCV ದಾಖಲೆಗಳು.
-
NLP ಪೈಪ್ಲೈನ್ಗಳಿಗಾಗಿ ಸ್ಪಾಸಿ ಬಳಕೆಯ ಮಾರ್ಗದರ್ಶಿ.
ಸಣ್ಣ ಲೈಫ್-ಹ್ಯಾಕ್: ನಿಮ್ಮ GPU ಇನ್ಸ್ಟಾಲ್ ಆಜ್ಞೆಯನ್ನು ಉತ್ಪಾದಿಸುವ ಅಧಿಕೃತ ಇನ್ಸ್ಟಾಲರ್ಗಳು ಲೈಫ್ ಸೇವರ್ಗಳಾಗಿವೆ [2][3].
ಎಲ್ಲವನ್ನೂ ಒಟ್ಟಿಗೆ ಸೇರಿಸುತ್ತಿದ್ದೇನೆ 🧩
-
ಗುರಿ → ಬೆಂಬಲ ಟಿಕೆಟ್ಗಳನ್ನು 3 ಪ್ರಕಾರಗಳಾಗಿ ವರ್ಗೀಕರಿಸಿ.
-
ಡೇಟಾ → CSV ರಫ್ತು, ಅನಾಮಧೇಯಗೊಳಿಸಲಾಗಿದೆ, ವಿಭಜನೆ.
-
ಬೇಸ್ಲೈನ್ → scikit-ಲರ್ನ್ TF-IDF + ಲಾಜಿಸ್ಟಿಕ್ ರಿಗ್ರೆಷನ್.
-
ಅಪ್ಗ್ರೇಡ್ → ಬೇಸ್ಲೈನ್ ಸ್ಥಗಿತಗೊಂಡರೆ ಟ್ರಾನ್ಸ್ಫಾರ್ಮರ್ ಅನ್ನು ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡಿ.
-
ಡೆಮೊ → ಗ್ರೇಡಿಯೊ ಪಠ್ಯಪೆಟ್ಟಿಗೆ ಅಪ್ಲಿಕೇಶನ್.
-
ಹಡಗು → ಡಾಕರ್ + README.
-
ಪುನರಾವರ್ತಿಸಿ → ದೋಷಗಳನ್ನು ಸರಿಪಡಿಸಿ, ಮರುಲೇಬಲ್ ಮಾಡಿ, ಪುನರಾವರ್ತಿಸಿ.
-
ಸುರಕ್ಷತೆ → ದಾಖಲೆ ಅಪಾಯಗಳು [4].
ಇದು ನೀರಸವಾಗಿ ಪರಿಣಾಮಕಾರಿಯಾಗಿದೆ.
ಟಿಎಲ್;ಡಿಆರ್ 🎂
ನಿಮ್ಮ ಕಂಪ್ಯೂಟರ್ನಲ್ಲಿ AI ಅನ್ನು ಹೇಗೆ ರಚಿಸುವುದು ಎಂಬುದನ್ನು ಕಲಿಯುವುದು = ಒಂದು ಸಣ್ಣ ಸಮಸ್ಯೆಯನ್ನು ಆರಿಸಿ, ಬೇಸ್ಲೈನ್ ಅನ್ನು ನಿರ್ಮಿಸಿ, ಅದು ಸಹಾಯ ಮಾಡಿದಾಗ ಮಾತ್ರ ಅದನ್ನು ಪರಿಹರಿಸಿ ಮತ್ತು ನಿಮ್ಮ ಸೆಟಪ್ ಅನ್ನು ಪುನರುತ್ಪಾದಿಸುವಂತೆ ನೋಡಿಕೊಳ್ಳಿ. ಅದನ್ನು ಎರಡು ಬಾರಿ ಮಾಡಿ ಮತ್ತು ನೀವು ಸಮರ್ಥರೆಂದು ಭಾವಿಸುವಿರಿ. ಅದನ್ನು ಐದು ಬಾರಿ ಮಾಡಿ ಮತ್ತು ಜನರು ನಿಮ್ಮಿಂದ ಸಹಾಯ ಕೇಳಲು ಪ್ರಾರಂಭಿಸುತ್ತಾರೆ, ಇದು ರಹಸ್ಯವಾಗಿ ಮೋಜಿನ ಭಾಗವಾಗಿದೆ.
ಮತ್ತು ಹೌದು, ಕೆಲವೊಮ್ಮೆ ಟೋಸ್ಟರ್ಗೆ ಕವಿತೆ ಬರೆಯಲು ಕಲಿಸಿದಂತೆ ಭಾಸವಾಗುತ್ತದೆ. ಪರವಾಗಿಲ್ಲ. ಟಿಂಕರಿಂಗ್ ಮಾಡುತ್ತಲೇ ಇರಿ. 🔌📝
ಉಲ್ಲೇಖಗಳು
[1] scikit-learn — ಮೆಟ್ರಿಕ್ಸ್ & ಮಾದರಿ ಮೌಲ್ಯಮಾಪನ: ಲಿಂಕ್
[2] PyTorch — ಸ್ಥಳೀಯ ಸ್ಥಾಪನೆ ಆಯ್ಕೆದಾರ (CUDA/ROCm/Mac MPS): ಲಿಂಕ್
[3] ಟೆನ್ಸರ್ಫ್ಲೋ — ಸ್ಥಾಪನೆ + GPU ಪರಿಶೀಲನೆ: ಲಿಂಕ್
[4] NIST — AI ಅಪಾಯ ನಿರ್ವಹಣಾ ಚೌಕಟ್ಟು: ಲಿಂಕ್
[5] llama.cpp — ಸ್ಥಳೀಯ LLM ರೆಪೊ: ಲಿಂಕ್