最近の投稿
Google Imagen3 を試す
December 17, 2024Google の画像生成AIである Imagenが3になりましたので、試してみました。 結論、すごいです。 公式WEBサイト https://deepmind.google/technologi...
Claudeデスクトップ&MCP で Puppeteer を操作する
November 28, 2024https://github.com/modelcontextprotocol/servers/tree/main/src/puppeteer バグ回避 手動で @modelcontextpro...
Claudeデスクトップ&MCP で Brave search
November 28, 20242024-11-28 時点では、Windows版の Claude アプリでは、チュートリアルの通りの設定をしても、node との連携が正常に行えない状態です。 対処する Issue commen...
日本語に特化したOCR、文書画像解析 YomiToku
November 27, 2024Kotaro.Kinoshita さんが、日本語OCRを公開しました。 https://note.com/kotaro_kinoshita/n/n70df91659afc 文書のレイアウト構造や...
Claudeデスクトップ&MCP で DB を操作する
November 27, 2024Claudeが、デスクトップアプリを介して、ローカルのファイルシステムやDB、ブラウザ操作の機能を提供しました。 MCP – Model Context Protocol 現状は、自...
Llama-3.1-Swallow-8B-Instruct-v0.2 を試す
November 23, 2024Llama-3.1-Swallow-8B-Instruct-v0.2 が公開されたので、試します。 https://swallow-llm.github.io/llama3.1-swallow....
Recraft.ai を試す
November 18, 2024Midjourney を始め、画像生成サービスはたくさんありますが、今日は、ベクター画像を生成できという噂の Recraft AI を試してみました。 Recraft ai https://ww...
LLMでPC を操作 – Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku
October 23, 20242024-10-23 AI がまた新しいステージに入りました。LLM で OS を操作するステージに入りました。 https://www.anthropic.com/news/3-5-model...
gemma-2-9b-it-GGUF を試す
August 09, 2024Google Gemma 2 Google の OPEN LLM です。 今回は 90億(9B)と270億(27B)の2つが公開されました。 27Bの方は、量子化してもサイズが大きすぎて私の手持...