Энэ бол Microsoft Phi-3.5 tflite загваруудыг ашигласан Android-ийн жишээ юм.
Android LLM Inference API нь Android аппликейшнуудад зориулан том хэмжээний хэлний загваруудыг (LLM) бүрэн төхөөрөмж дээр ажиллуулах боломжийг олгодог. Үүнийг ашиглан текст үүсгэх, байгалийн хэлээр мэдээлэл авах, баримт бичгийг хураангуйлах гэх мэт олон төрлийн даалгавруудыг гүйцэтгэж болно. Энэ даалгавар нь олон төрлийн текстээс текст рүү чиглэсэн том хэлний загваруудыг дэмждэг тул хамгийн сүүлийн үеийн төхөөрөмж дээрх generative AI загваруудыг таны Android апп-д ашиглах боломжтой.
Google AI Edge Torch нь PyTorch загваруудыг .tflite формат руу хөрвүүлэхийг дэмждэг python сан бөгөөд үүнийг TensorFlow Lite болон MediaPipe ашиглан ажиллуулах боломжтой. Энэ нь Android, iOS болон IoT төхөөрөмжүүдэд загваруудыг бүрэн төхөөрөмж дээр ажиллуулах боломжийг олгодог. AI Edge Torch нь CPU-гийн өргөн хүрээг хамардаг бөгөөд GPU болон NPU-ийн эхний шатны дэмжлэгтэй. AI Edge Torch нь PyTorch-тэй нягт уялдаж, torch.export() дээр суурилан Core ATen операторуудыг өргөн хамрахыг зорьдог.
-
Энэ жишээ нь зөвхөн Android 14+ хувилбарт зориулагдсан.
-
Python 3.10.12-ийг суулгах.
Санал болгох: Python орчноо conda ашиглан суулгаарай.
- Ubuntu 20.04 / 22.04 (анхаарлаа google ai-edge-torch дээр төвлөрүүлнэ үү)
Санал болгох: Azure Linux VM эсвэл гуравдагч этгээдийн үүлэн VM ашиглан орчноо үүсгээрэй.
- Linux bash дээрээ очоод Python сан суулгаарай.
git clone https://github.com/google-ai-edge/ai-edge-torch.git
cd ai-edge-torch
pip install -r requirements.txt -U
pip install tensorflow-cpu -U
pip install -e .
- Hugging Face-ээс Microsoft-3.5-Instruct-ийг татаж ав.
git lfs install
git clone https://huggingface.co/microsoft/Phi-3.5-mini-instruct
- Microsoft Phi-3.5-ийг tflite руу хөрвүүлнэ.
python ai-edge-torch/ai_edge_torch/generative/examples/phi/convert_phi3_to_tflite.py --checkpoint_path Your Microsoft Phi-3.5-mini-instruct path --tflite_path Your Microsoft Phi-3.5-mini-instruct tflite path --prefill_seq_len 1024 --kv_cache_max_len 1280 --quantize True
Эхлээд mediapipe-ийг суулгаарай.
pip install mediapipe
Тэмдэглэлийн дэвтэртээ дараах кодыг ажиллуулаарай.
import mediapipe as mp
from mediapipe.tasks.python.genai import bundler
config = bundler.BundleConfig(
tflite_model='Your Phi-3.5 tflite model path',
tokenizer_model='Your Phi-3.5 tokenizer model path',
start_token='start_token',
stop_tokens=[STOP_TOKENS],
output_filename='Your Phi-3.5 task model path',
enable_bytes_to_unicode_mapping=True or Flase,
)
bundler.create_bundle(config)
adb shell rm -r /data/local/tmp/llm/ # Remove any previously loaded models
adb shell mkdir -p /data/local/tmp/llm/
adb push 'Your Phi-3.5 task model path' /data/local/tmp/llm/phi3.task
It seems like "mo" could refer to a language or abbreviation, but it's not entirely clear which one you mean. Could you clarify whether "mo" refers to a specific language (e.g., Maori, Montenegrin, or something else)? If so, I'd be happy to assist with the translation!