埋め込みベクトル・生成AIの種/株式会社翠川の実績

埋め込みベクトルは、データをn次元空間上の点として表現します。この空間では、意味的に近いデータは近くに配置され、遠いデータは離れて配置されます。例えば、「king」と「queen」のベクトルは近く、「犬」と「車」のベクトルは遠くに位置します。

また、埋め込みベクトルは、次のような問題を解決します。

高次元性とスパース性: One-Hot Encodingのような高次元で疎な表現を避け、数百次元の密なベクトルで効率的に表現。(自然言語からn次元のベクトルに変換して情報処理)

単語間の意味的な類似性をベクトル間の距離や角度で表現。(n次元ベクトルも行列の1種)

埋め込みベクトルの生成方法埋め込みベクトルは、以下の方法で生成されます。事前学習済みモデル: Word2Vec、GloVe、FastText、BERTなどのモデルを使用して、テキストや画像データをベクトル化。

タスクと同時に学習: 特定のタスク(例: 感情分析、機械翻訳)を学習する過程で埋め込みを生成。

例えば、OpenAIのtext-embedding-ada-002モデルを使用すると、任意のテキストを1536次元のベクトルに変換できます。

応用例埋め込みベクトルは、以下の分野で活用されています。

自然言語処理 (NLP): テキスト分類、機械翻訳、質問応答、文書の類似性検索。

推薦システム: ユーザーの好みや商品の特徴をベクトル化し、パーソナライズされた提案を実現。
画像認識: 画像をベクトル化して類似画像検索や分類に利用。
異常検知: ベクトル間の距離を基に異常なパターンを検出。
グラフ分析: ソーシャルネットワークやリンク予測におけるノードの関係性をベクトルで表現。

ベクトルの類似性

埋め込みベクトル間の類似性を測る方法として、コサイン類似度が一般的です。これは、ベクトル間の角度(cosθ)を計算し、値が1に近いほど類似していることを示します。

現在の画像に代替テキストがありません。ファイル名: word_embedding_king_queen.jpg

以上の処理を経て意味空間を持った埋込ベクトルを、大量の教師文書を読みDeep Leaningに学習させることにより行列の数学的処理により、LLM、大規模モデルは実現しています。

株式会社翠川は、埋込ベクトルを使って企業内の全文書、全メール、メッセージを埋込ベクトルに変換し全文書を串刺し検索するナレッジ・マネッジメント・ソフトのGUI設計に関わった経験があります。

画像生成AI、動画生成AIについては高度なクリエイターを確保しておりますので、お客様に品質の高いアウトプットをご提供可能です。お気軽に株式会社翠川までお問い合わせください。

生成AI,動画生成AI,画像生成AIについて

■web上にある半数の文章はAIによるもの
2025年の調査によると、新たに公開されたウェブページの約74%にAI生成コンテンツが含まれていることが明らかになっています。 [ahrefs.com]
この調査はAhrefs社が実施したもので、90万件の英語ウェブページを対象にAIコンテンツ検出ツール「bot_or_not」で分析した結果です。詳細は以下の通りです:

完全にAI生成:2.5%
完全に人間作成:25.8%
人とAIの混在:71.7%

そのうち、AI生成の割合が高いページも多数存在

つまり、完全にAIが書いた文章は少数ですが、人間とAIが共同で作成したコンテンツを含めると、約4分の3のページにAIが関与しているということになります。
この傾向は、GoogleドキュメントやGmail、LinkedInなどのツールにAI機能が標準搭載されていることも影響しており、AIによる文章生成が日常的になりつつあることを示しています。

■使用された判定方法とツールの仕組み
Ahrefsは、「bot_or_not」などのAI検出ツールを使って、90万件のウェブページを分析しました。これらのツールは、以下のような技術を用いてAI生成かどうかを判定します: [ja.quickcreator.io]
主な判定指標

困惑度(Perplexity):文章の予測困難さ。AI生成文は予測しやすいため困惑度が低くなる傾向があります。
バースト性(Burstiness):単語やフレーズの出現頻度のばらつき。AI文は均一になりがち。
構文構造の一貫性:主語-動詞-目的語(SVO)などの構文パターンが一定。
文体の特徴:繰り返し表現や直線的な構成など、AI特有の文体。
NLP(自然言語処理):文脈や論理性、専門性などを解析。

判定の流れ

大量の人間が書いた文章とAIが生成した文章を学習データとして使用。
新しい文章をこれらと比較し、AI生成の可能性を確率で算出。
結果は「完全にAI」「完全に人間」「混在」などのカテゴリに分類。

判定の限界

100%の精度ではない:誤検知やすり抜けもあり得ます。
人間による後処理(リライトなど)で検出困難になる場合もある。
ウォーターマーク(隠しマーカー)を使う方法もありますが、これは一部のAIモデルに限られます。 [ahrefs.com]

つまり、AIがAIを判定しているという構図であり、人間の目による最終確認は補助的な役割にとどまっています。

株式会社翠川は高度な画像生成AI、動画生成AI、LLMを使った画像、動画、レポートを承ります。お気軽にお問い合わせください。

プロフェッショナルをリモートワーク

株式会社翠川ではプロフェッショナルを繋ぐ、リモートワークでお客様の利益を最大化するためデザイン制作、デザインコンサルティングを提供しています。

先進の自動運転によるコンセプトカーデザインから名刺デザインまでなんなりとお申し付けください。

Designed by 株式会社翠川

世界のAR・VR市場、2021年に23兆規模

拡張現実(AR)と仮想現実(VR)と関連の世界市場は2021年に17年比19倍の2150億ドル(約23兆6500億円)の規模に達すると予測されています。

日本ではこの分野は立ち遅れているため、株式会社翠川では、この分野にも注力していきます。

メールにてお気軽にお問合せください。

 

 

Designed by 株式会社翠川

新しい形のオンライショッピング

株式会社翠川は、「Wowma! for au」、KDDIコマースフォワード株式会社と非常に新しい形のオンライショッピングを検討、準備中であることをお知らせ致します。続報にご期待ください。

Wowma! for au
https://m.aumall.jp/
KDDIコマースフォワード株式会社
http://kddi-cf.co.jp/

 

Designed by 株式会社翠川

検索で振り返る 2016

 Googleから、「検索で振り返る 2016 」が発表されております。
株式会社翠川は、某流行語大賞や某キュレーションサイト、表面的な流言飛語に惑わされる事なく、デザインを制作し企画を提案し、お客様の利益最大化、ブランディングを支援しています。

 

 最も難しいAIと言われている自然言語処理、Deep Leraning、ビックデータ活用の経験も活かし、定量、定性的にマーケットを分析し、適切なタイミングでデザインに活かしています。

 

 地方公共団体の地方創生のデザイン・コンサルティング業務、更には拡大が予測される医療、ヘルスケア分野に於いてもお客様に最善のアウトプットを追及し続けます。

 

デザインのシンクタンク、 株式会社翠川。

今後も的確な情報分析から、結果を出すデザイン、問題を解決するデザインを志向していきます。

 

Designed by 株式会社翠川

弊社代表 翠川真は美術館館長として、美術館を開館させ軌道に載せる

弊社、代表取締役 翠川真は、地方創生の一環で、公立美術館・館長を委任され、市立岡谷美術考古館を開館し、プロモーション、ブランディングを指揮し美術館運営を無事軌道に載せました。(2013年8月1日~2015年5月31日まで)
musea

市立岡谷美術考古館 創刊号  

弊社は地方創生や各自治体、街づくりのプロモーション・コンサルティング業務も行っておりますのでお気軽にお問合せください。

 
 
 

Designed by 株式会社翠川

上方修正、総額30万円分プレゼント

既報の通り総額、AdWords,20万円分、AdWords Express,10万円分、併せて総額30万円分のキャンペーンを実施中です。
現在お問合せが多く既存ウェブのスマホ対応等も対象になります。
当ボーナスキャンペーンは先着順2013年6月30日までになっておりますので、お気軽にお問合せください

smartphone

Designed by 株式会社翠川