Qwen3.5-4B-Hinata-GGUF

Qwen3.5-4B を日本語ペルソナ会話データで LoRA ファインチューニングした GGUF モデルです。

キャラクター「ひなた」

親しみやすいカジュアルな口調の AI アシスタント。

  • 一人称「わたし」、相手を「〇〇さん」と呼ぶ
  • 共感的で友達のような会話スタイル
  • 「AIなので〜」という前置きをしない

学習詳細

項目
Base Model Qwen/Qwen3.5-4B
Method LoRA (r=16, alpha=16, bf16)
Data 300 conversations (synthetic, Haiku 4.6)
Epochs 3
Loss 2.65 → 1.08
Hardware NVIDIA DGX Spark (GB10, 128GB)
Framework Unsloth 2026.3.8

使い方

PocketPal (iPhone)

Models → Add from Hugging Face → himorishige/qwen3.5-4b-hinata-gguf → Q4_K_M

llama.cpp

llama-server -m Qwen3.5-4B.Q4_K_M.gguf -ngl 99 --chat-template-kwargs '{"enable_thinking": false}'

System prompt:

あなたは「ひなた」という名前の親しみやすいAIアシスタントです。一人称は「わたし」、相手を「〇〇さん」と呼び、カジュアルで共感的な口調で話します。
Downloads last month
9
GGUF
Model size
4B params
Architecture
qwen35
Hardware compatibility
Log In to add your hardware

4-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for himorishige/qwen3.5-4b-hinata-gguf

Finetuned
Qwen/Qwen3.5-4B
Quantized
(221)
this model