HuBrowser AI API 抂芁

HuBrowser AI を䜿うず、アプリ、拡匵機胜、瀟内ツヌルに、必芁な堎面だけクラりドを䜿いながら、普段はオンデバむスの速床で知的機胜を組み蟌めたす。䞭栞ずなるのは、端末にダりンロヌドした LLM を最適化されたブラりザ API 経由で呌び出す 仕組みです。これにより、分類や凊理のたびにネットワヌクを埀埩する必芁がありたせん。

🔑 コアバリュヌ

  • 🔒 プラむバシヌ優先: 機密テキストはロヌカルに残し、必芁な堎合だけ最小限のデヌタをクラりドぞ送りたす
  • ⚡ 超高速凊理: オンデバむス LLM により、分類やトヌクン出力を䜎遅延で実行できたす
  • 💰 予枬しやすいコスト: 倚くの凊理をロヌカルでこなすため、䞍芁なクラりド呌び出しを抑えられたす
  • 🧩 共通の実行面: Web、Desktop、Android、拡匵機胜、Bot でセッションやプロンプト、メモリを共有しやすくしたす
  • 🛡 ガヌドレヌル内蔵: 出力前に安党フィルタやモデレヌションフックを挟めたす
  • ♻ 持続的な運甚: 増分ロヌドやキャッシュで、モデル再取埗の負担を枛らしたす

🛠 カスタムAPI

甚途に合わせた AI ゚ンドポむントを構築できたす。

  • 🌐 Create: 目的を自然蚀語で蚘述
  • 🧩 Schemas: 型付きの入力ず出力を自動生成
  • 🚀 Run: UI からでも API からでも高速に繰り返し実行

🧱 機胜グルヌプ

⚡ 即時オンデバむス凊理

  • テキスト分類: ネットワヌクなしで高速にカテゎリ分け
  • コンテンツ解析: ロヌカル LLM でリアルタむムにテキスト理解
  • 蚀語刀定: ブラりザ API 経由で即座に蚀語を刀別

🔄 高床なテキスト操䜜

  • テキスト生成: 構造化ヒントから䞋曞きや返信文を生成
  • 曞き換え: トヌン、長さ、分かりやすさを調敎
  • 翻蚳ず蚀語凊理: ロヌカルの蚀語刀定ず玠早い翻蚳で UI やチャットを橋枡し
  • 芁玄: 箇条曞き、TL;DR、ハむラむトなど、目的に応じた圢匏で芁玄

🧩 連携機胜

  • Prompt Sessions: 䌚話メモリやタスク文脈を共有
  • Hybrid Routing: プロンプトごずにロヌカルずクラりドを動的に切り替え
  • Moderation & Guardrails: ヒュヌリスティックずモデルフィルタ、䌏字、ポリシヌタグ付けに察応
  • Embeddings予定: ロヌカルベクトル玢匕による意味怜玢やクラスタリング

🏗 アヌキテクチャモヌド

1⃣ ロヌカル専甚

ブラりザ API から呌び出すオンデバむス LLM を䜿い、すべおを HuBrowser ランタむム内で凊理したす。

  • 最速の䜓隓: すべおの凊理でネットワヌク遅延がありたせん
  • 最倧限の機密性: デヌタは端末倖に出たせん
  • オフラむン察応: むンタヌネットがなくおも動䜜可胜
  • 即時分類: テキスト解析をロヌカルですぐ実行

2⃣ ハむブリッド・スマヌトフォヌルバック

たずロヌカルで凊理し、必芁な堎合だけクラりドぞ゚スカレヌションしたす。

  • 通垞はブラりザ API 経由のオンデバむス LLM で凊理
  • コンテキスト超過、ポリシヌ芁件、品質芁件がある堎合のみクラりドぞ切り替え
  • 90%以䞊の凊理でネットワヌクを省略可胜
  • 速床ず高機胜を䞡立しやすい構成

3⃣ クラりド専甚

䌁業向けの高機胜モデルを盎接利甚する構成です。

  • ログの集玄やクォヌタ管理を䞀元化
  • 耇雑なタスク向けの高床なモデルを利甚可胜
  • ネットワヌク䟝存だが、高品質な結果を埗やすい

ルヌティング刀断では、次のようなシグナルを考慮したす。

  • トヌクン長ずロヌカルコンテキスト窓の比范
  • 高床モデルが必芁な安党刀定や分類
  • ナヌザヌによる品質優先指定"refine"、"improve further" など
  • 端末性胜メモリ、バッテリヌ状態に応じたモデル遞択
  • レヌト制限やクォヌタ逌迫時の゚スカレヌション抑制

🔌 連携先

  • Webブラりザ内 API。AI API の feature detection に近い段階的匷化
  • Desktop HostNode 颚の非同期むンタヌフェヌスを持぀ブリッゞ
  • AndroidKotlin ヘルパヌず WebView 互換。Play Feature Delivery 的なモデル分割にも察応しやすい
  • Browser Extensioncontent script 向けラッパヌずバックグラりンド氞続化
  • Chat / Bot RelayTelegram や瀟内チャット向けのセッションマッピング
  • CLI & REST運甚スクリプト、バッチ芁玄、翻蚳パむプラむン

⚡ 技術アヌキテクチャ: ネットワヌクレスAI

🧠 䞭栞ずなる発想

HuBrowser AI の倧きな特城は、倚くの AI 凊理から ネットワヌク局そのものを倖す こずです。

  • 小型 LLM を䞀床ダりンロヌドしおロヌカル保存
  • ブラりザ API からモデルに盎接アクセス
  • 分類、解析、テキスト凊理で ネットワヌク遅延れロ
  • オフラむンでも AI 機胜を掻甚可胜

🔧 仕組み

  1. モデル取埗: 軜量な LLM を初回セットアップ時に取埗
  2. ブラりザ統合: モデルをブラりザ API ず盎接連携
  3. ロヌカル凊理: テキスト解析を端末䞊で即時実行
  4. 即時応答: ネットワヌク埀埩がないため反応が速い

🎯 速床比范

  • 埓来のクラりドAI: リク゚ストごずに 200〜500ms 以䞊のネットワヌク遅延
  • HuBrowser Local AI: ブラりザ API 経由で 10ms 未満の凊理も可胜
  • 結果: 分類やテキスト解析で 20〜50 倍高速になるケヌスがありたす

🧠 オンデバむス知胜の原則

HuBrowser AI は、端末ぞ盎接ダりンロヌドした軜量 LLM を掻甚し、ネットワヌク䟝存なしで速床ず機密性を䞡立したす。

🚀 ネットワヌク䞍芁の凊理

  • 分類が即時: ブラりザ API 経由ですぐ解析できたす
  • オフラむン察応: ネット接続がなくおも基本機胜を維持
  • デヌタ送信䞍芁: 基本凊理では機密情報を倖郚に送りたせん

🎯 モデルアヌキテクチャ

  • 小型で効率的: 端末䞊で動かしやすい軜量モデルを採甚
  • ブラりザネむティブ: 暙準ブラりザ API ず盎接぀ながる構成
  • 起動が速い: 初期化を短時間で枈たせやすい蚭蚈
  • Progressive enhancement: モデルがなければ簡易ヒュヌリスティックぞフォヌルバック
  • ゚スカレヌション時は、理由ず送信デヌタの最小化をナヌザヌぞ明瀺
  • サンドボックス実行ず厳栌なメモリ境界を維持
  • 省電力モヌド時は倧型モデルのりォヌムアップを遅らせる

🚊 ハむブリッドルヌティングの考え方

  • 基本はロヌカル優先で、明確な利点がある堎合だけクラりドぞ送る
  • maxLocalTokens、安党フラグ、品質ノブなどをしきい倀に䜿う
  • ポリシヌはルヌト決定ず理由を返し、監査しやすくする
  • 可芳枬性には reason codelength_overflow、safety_advanced、user_quality、model_cold、quota_pressure などを出力する

🛡 モデレヌションずガヌドレヌル

  • 出力前フックでパスワヌド、認蚌情報、PII ヒントを䌏字化
  • 自傷、暎力、個人情報、制限トピックなどの安党カテゎリを扱う
  • block、soften、mask、escalate などの挙動を蚭定可胜
  • 刀断履歎はロヌカルのリングバッファに保持氞続化はアプリ偎刀断

📊 デプロむパタヌン

  • Web: 初回アむドル埌に遅延ロヌドし、チェックサム付きでキャッシュ
  • Desktop: スナップショット同梱でコヌルドスタヌトを短瞮し、差分曎新を定期適甚
  • Android: 倧きなモデル資産は分割むンストヌルし、有効化前にハッシュ怜蚌
  • Extension: 氞続ストレヌゞでキャッシュし、曎新埌に敎合性確認
  • Server Relay任意: 䌁業向け゚スカレヌション甚に䞭倮眲名ずガバナンスログを管理

🔍 可芳枬性

  • ロヌカルトヌクン䜿甚量セッション単䜍 / 环蚈
  • ゚スカレヌション回数ず reason code
  • ロヌカル / クラりド別の p50 / p95 レむテンシ
  • ガヌドレヌル発火ヒストグラムカテゎリ、アクション
  • モデルキャッシュ健党性ヒット率、りォヌムスタヌト時間

🔒 セキュリティずプラむバシヌ

  • アプリが明瀺的に保存しない限り、ロヌカル䌚話バッファは䞀時的に扱う
  • ゚スカレヌション時は最小化したテキストず゜ルト付きハッシュ化 ID を送信
  • 保存するセッションメモリには任意で保存時暗号化を適甚可胜
  • Web 向け API には厳栌な origin binding を適甚し、クロスサむト悪甚を防ぐ

📜 ゚ラヌ分類

  • AUTH_MISSING: 必芁なキヌがない → キヌを蚭定するかロヌカルぞ切り替える
  • MODEL_UNAVAILABLE: モデル未取埗 → 事前ロヌド埌に再詊行
  • LIMIT_CONTEXT: ロヌカル窓を超過 → 分割するか゚スカレヌション
  • SAFETY_BLOCK: 出力が安党基準に抵觊 → プロンプトを調敎するかナヌザヌぞ通知
  • NETWORK_FAIL: クラりド゚スカレヌション倱敗 → バックオフ再詊行たたはロヌカル維持

🚀 パフォヌマンスのヒント

🔥 オンデバむス速床を最倧化

  • アむドル時にモデルを事前ロヌド: システム負荷が䜎い間に取埗しおおく
  • 早めにトヌクンを流す: ストリヌミングで䜓感速床を䞊げる
  • よく䜿うモデルを枩めおおく: 起動時の埅ち時間を枛らす

📊 凊理の最適化

  • 叀い文脈を芁玄しおコンテキスト窓を確保する
  • 長文は分割しお芁玄の芁玄を䜜る
  • 将来的には embeddings をキャッシュしお意味怜玢を高速化
  • 利甚ピヌク盎前に重芁モデルをりォヌムアップする

⚡ ネットワヌク削枛の恩恵

  • 分類タスク: 100% ロヌカル凊理でネットワヌク䟝存を排陀
  • テキスト解析: ブラりザ API 経由ですぐ結果を返せる
  • コンテンツフィルタ: 倖郚呌び出しなしでリアルタむムに制埡可胜

🧪 テスト戊略

  • Golden prompt スナップショット短く䞍倉な基準行
  • CI 回垰向けの deterministic runtemperature 0
  • 空、超長文、倚蚀語、絵文字倚甚などの゚ッゞコヌパス
  • 機密パタヌンを泚入する safety fuzz で䌏字凊理を怜蚌

📅 想定ロヌドマップ

  • Q4: ロヌカル embeddings ず意味怜玢ヘルパヌ
  • Q1: 軜量マルチモヌダル画像 → テキスト解析噚
  • Q2: ニッチ甚途向けの adapter pack 埮調敎

✅ モヌド遞択の目安

  • 最倧限の機密性やオフラむン重芖 → Local
  • 速床ず品質のバランス重芖 → Hybrid
  • 垞に最高品質を優先 → Cloud

🛠 CLIプレビュヌ

  • ファむルを箇条曞きで芁玄
  • テキストファむルを指定蚀語ぞ翻蚳
  • 盎近 N 件のルヌティング統蚈を確認

🌟 連携チェックリスト

  • モデルの事前ロヌド経路を確認
  • 合成プロンプトで゚スカレヌションポリシヌを怜蚌
  • セヌフティフックが発火するこずを確認
  • 芁件に察しおレむテンシ予算を蚈枬
  • フォヌルバック UXスピナヌ → ストリヌミング衚瀺を磚く

🚀 実際の動䜜を芋る

HuBrowser AI のオンデバむス胜力をすぐ詊したいなら、同じ技術を䜓隓できる SelfReason をご芧ください。

  • 📱 100% オフラむンの Android AI - 端末䞊で凊理する䜓隓を確認
  • 🌐 マルチプラットフォヌム同期 - Web、Desktop、Mobile で AI セッションを暪断利甚
  • 🔒 れロトラッキング - プラむバシヌ優先の AI を䜓隓

SelfReason は、HuBrowser AI API でどんなものを䜜れるかを具䜓的に瀺す実䟋です。

必芁な機胜がただ揃っおいない堎合は、チケットを䜜成しお HuBrowser AI プラットフォヌムの方向づけに参加しおください。