FitGap

FitGapの評価メソッド

FitGapは、ソフトウェア製品の評価・分類を行うテクノロジー選定エンジンを自社で開発・運用しています。200以上のカテゴリで15,000以上の製品を評価対象としています。

評価プロセスは、AI・SaaS業界でのリサーチ経験を持つFitGapの編集・リサーチチームが設計・運用しています。

ページ上部の診断コンテンツと記事コンテンツは、同じ評価エンジンのデータ基盤で動いています。このページでは、評価エンジンの仕組みと、記事コンテンツにおけるおすすめ製品の選定ロジックを説明します。


3層構造の評価エンジン

評価エンジンは、要件定義・要件マッチング・スコアリングの3層で構成されています。

第1層:カテゴリ別の要件定義

カテゴリごとに、製品選定で重要になる機能・連携・特性を「要件」として定義しています。会計ソフトなら「銀行API取込」「部門別配賦」、LLMなら「RAG対応」「コード補完」といった内容です。

各要件はカテゴリ固有で定義しています。例えば「通話機能」はCRMとコンタクトセンターでは求められる内容が異なるため、同じ名称でも別の要件として扱います。全カテゴリで8,800以上の要件を定義しており、1カテゴリあたり平均約43件です。

定義した要件は、カテゴリ内の製品対応率をもとに4象限に分類しています。

  • ほぼ全製品が対応:大多数の製品が対応している基本要件
  • 選定の決め手:対応している製品とそうでない製品に分かれ、導入判断を左右する要件
  • 一部の企業が必須:特定の業種・業務に必要な要件
  • 優先度が低い:対応していれば差別化になるが、必須ではない要件

この4象限をベースに、評価対象とする要件を絞り込んでいます。対応率が90%以上の要件は製品間の差分が生まれないため除外し、対応率が10%以下の要件やFitGapのリサーチャーがニッチと判断した要件も除外しています。最終的に、ワークフロー上重要でかつ製品差分が生まれる要件をリサーチャーが選定しています。

要件そのものの品質は、4つの基準で管理しています。

  • 差分化:製品間で差が出ない要件は判断軸として機能しないため除外します
  • 一意性:意味が重複する要件は統合し、1要件=1評価対象を原則としています
  • 理解容易性:略語や技術用語を避け、選定担当者が迷わず理解できる表現にしています
  • 粒度の適正度:「在庫管理」のように選定段階で有用な粒度に保ち、APIメソッド単位のような実装レベルの要件は統合しています

第2層:製品ごとの要件マッチング

カテゴリ内の各製品について、第1層で定義した要件への対応状況を1件ずつ評価しています。判定は「対応」「非対応」「未検証」の3段階です。これにより、製品ごとの対応データベースを作成しています。

第3層:スコアリング

第2層の対応データベースに加えて、製品の総合力と市場での利用実態を数値化するスコアリングを行っています。Metafitスコアとシェアスコアの2種類があります。

Metafitスコア

以下の7項目で製品の総合力を評価しています。

  • 使いやすさ
  • セットアップのしやすさ
  • 料金
  • 機能性
  • サポート充実度
  • セキュリティ統制
  • 連携・拡張性

各項目のスコアは、複数の情報源を組み合わせて算出しています。製品の公式ドキュメント・ヘルプページ・料金体系・公開されているユーザー評価など、入手可能な公開情報をFitGapのリサーチャーが収集・分析し、項目ごとのスコアを生成します。その際、カテゴリ内の代表的な製品を基準点(アンカー)として設定し、各製品のスコアを基準点との相対評価で算出しています。

アンカー方式を採用している理由は、「製品Xを0〜10で評価せよ」という絶対評価よりも、「製品XはSalesforceと比較してサポート充実度はどうか」という相対評価の方が、評価のばらつきが小さく安定するためです。

7項目を分離してスコアリングしているのは、製品によって強みの分布が異なるためです。例えば、使いやすさに優れるがセットアップに専門知識を要する製品や、機能性は高いが料金が割高な製品があります。総合スコアだけでは見えないトレードオフを把握できるようにしています。

シェアスコア

製品の利用実績データをもとに、カテゴリ内での利用シェアをスコア化しています。全体のシェアに加え、企業規模別(3区分)と業種別(17区分)の計21軸でスコアを算出しています。

区分
全体カテゴリ全体での利用シェア
企業規模別(3軸)大企業・中堅企業・中小企業
業種別(17軸)IT・インターネット、製造、情報通信、卸売・小売、金融・保険、建設・不動産、医療・福祉、教育・学習支援、コンサルティング・広告・芸術、生活関連サービス・飲食・宿泊、人材・派遣、運輸・郵便、電気・ガス・水道、官公庁、農業 ほか

各軸の利用件数をMin-Max正規化(0〜1)で変換し、軸ごとの相対的な強弱を評価しています。診断コンテンツでは、ユーザーの回答内容に応じて製品単位で具体的なスコア付けがされます。

シェアスコアの算出に使用するデータソース、クロスバリデーション、分類別スコアリングの詳細は「シェアスコアの算出方法」をご覧ください。


記事コンテンツへの適用

記事コンテンツでは、評価エンジンのデータに加えて「タイプ」による分類を導入しています。

タイプ分け

製品を選ぶ際、細かな機能から比較を始めると選択肢が膨大になり、比較自体が困難になります。そこで、まず「自社の利用目的に合う製品グループはどれか」を大まかに特定し、その上で詳細な比較に進む構成にしています。この製品グループを「タイプ」と呼んでいます。

MAツールのカテゴリを例にとると、「BtoB向けMAツール」「BtoC向けMAツール」「ECサイト向けMAツール」のように、主な利用シーンや対象顧客の違いでタイプが分かれます。クラウド型・オンプレミス型のような静的な分類ではなく、実際のビジネス用途や対象ユーザー属性によって動的に定義しています。

タイプの決定プロセス:

  1. カテゴリ内の製品群を分析し、利用目的やユースケースに基づくタイプ候補を複数パターン作成します
  2. FitGapのリサーチャーが候補を評価します。実際に製品を操作し、利用企業へのインタビューも実施した上で、分類として成立するか、選定の判断軸として機能するかを検証します
  3. 最大3タイプに絞り込みます。数よりも分類の質を優先しています

おすすめ製品の選定ロジック

各タイプのおすすめ製品は、評価エンジンのデータを基に、以下の3つの観点を加重して選定しています。

観点配点評価エンジンとの対応
機能対応60%第1層の4象限のうち「選定の決め手」「一部の企業が必須」への対応率。対象要件はタイプごとに個別に定義
シェア評価20%第3層のシェアスコア。ページの対象セグメント(規模別・業種別)に該当する軸のスコアを使用
Metafitスコア20%第3層のMetafitスコア。7項目の総合値

実体験レビューの作成方法

おすすめ製品のレビューは、FitGapのリサーチャーが実際に製品を触って作成しています。

  • テスト中に取得したスクリーンショットを掲載し、各レビューの末尾にテスト環境とテスト実施日を記載しています
  • メリットだけでなく、テスト中に確認した注意点や制約も記載しています
  • 公式サイトや第三者のウェブサイトの情報を転記することはしていません

評価プロセスにおけるAIの補助的活用

評価プロセスの一部でAIを補助的に活用しています。

要件定義では、リサーチャーがカテゴリ内の製品群を調査する際に、AIを要件候補の洗い出しに活用しています。候補の精査・取捨選択・最終決定はリサーチャーが品質基準に照らして行います。

製品のスコアリングでは、公開情報の収集・整理にAIを活用しています。スコアの検証・補正はリサーチャーがアンカー方式で実施しています。

実体験レビューの作成では、リサーチャーによる実機検証の結果をもとに、AIが文章の下書きを生成し、リサーチャーが内容の正確性・表現を検証・修正して最終稿としています。製品の特徴抽出から実機検証、文章の最終確認まで、各工程でリサーチャーが品質を判断しています。


評価の中立性について

FitGapでは、適合度スコアの算出に広告やスポンサーの影響が入ることは一切ありません。すべての評価は、公平性を最優先に、客観的なアルゴリズムを用いて計算されています。また、特定のサービスを優遇することなく、常に利用者にとって最適な選択肢を提案することを目指しています。


評価の更新

FitGapの評価は、製品や市場の変化に応じて更新しています。

  • 要件定義は、カテゴリの変化や新しい機能の登場に合わせて見直します
  • 製品評価は、重要なアップデートや検証済みの修正依頼に基づいて再評価します
  • レビューは、テスト実施日を明記し、前回からの変更点があれば本文に反映します

お問い合わせ

評価メソッドに関するご質問やフィードバックは、hello@fitgap.com までお寄せください。製品情報の事実誤認については修正依頼を受け付けています。ベンダーからの申告は独立した情報源で検証した上で対応します。

最終更新日:2026年3月