カスタム Web サイトを Teamwork Graph に接続する
このコネクタを使用すると、Web サイトの検索クロールとインデックス化を実行して、検索結果に表示したり、Rovo チャットやエージェントで使用したりできます。
何がインデックス化されますか?
カスタム Web サイト コネクタは、次のオブジェクトをインデックス化します。
Web ページ (MIME タイプ:
text/html)テキスト ファイル (MIME タイプ:
text/plain)
各オブジェクトについて、次の属性がインデックス化されます。
名前
URL
createdDate
最終更新日
説明
ページ コンテンツ
はじめる前に
このコネクタは、お客様が所有するセキュアな (https) Web サイトのみをクロールできます。
Web サイトで利用できるページを確認することをお勧めします。すべての Teamwork Graph ユーザーは、クローラーが利用できるすべてのコンテンツ (設定済みの認証を使用するコンテンツを含む) にアクセスできます。
認証オプション
このコネクタは、現在、以下のサイトのクロールをサポートしています。
認証なし (公開サイト)
基本認証 (ユーザー名/パスワード、ログイン ページなし)
フォーム認証 (ユーザー名/パスワードを要求するログイン ページ)
基本認証とフォーム認証は、公開されておらず、個別の権限も必要としないサイト (例: 一部のイントラネットや社内ナレッジ ベース) が組織にある場合に適しています。
その場合でも、認証済みサイトの robots.txt ファイルを編集する必要があります。
幅広いコンテンツへのアクセス
認証を使用してサイトを接続すると、ご利用のサイトのすべての Teamwork Graph ユーザーが提供されたユーザー名とパスワードで利用できるすべてのコンテンツにアクセスできるようになります。
Teamwork Graph では、このサイトの個別の権限は遵守されません。
フォーム認証
フォーム認証を設定するには、Web サイトに表示されるログイン フォームの詳細を取得する必要があります。
ログイン URL: ユーザーがログイン画面を表示する URL です。ドメイン URL のサブドメインや異なる URL を指定できます。
https://で始まる必要があります。4 つのセレクター フィールド:
ユーザー名セレクター: ユーザーがユーザー名を入力する入力フィールド
パスワード セレクター: ユーザーがパスワードを入力する入力フィールド
ユーザー名送信セレクター (オプション): ログイン画面で最初にパスワード フィールドが表示されない場合、ユーザーがユーザー名を入力した後に押す必要があるボタン。例として、Atlassian ログイン画面があります (表示するには、シークレット ウィンドウで開く必要がある場合があります)。
パスワード送信セレクター: ユーザー名とパスワードを送信するボタン
セレクター フィールドとは
セレクターは、Web ページのコードでユーザー名とパスワードのフィールドを識別して、コネクタがサイトにログインできるようにします。
有効なセレクターの例:
#email#password
フォームベース認証を設定するには、少なくとも 3 つのセレクター (ユーザー名、パスワード、パスワード送信) をコピーして入力し、フォーム認証を設定する必要があります。
サイトからセレクターを見つける方法
Chrome からログイン画面のセレクターをコピーするには、次の手順に従います。
ログインしていないブラウザ (またはシークレット ウィンドウ) でログイン URL を開きます。
該当するテキスト ボックスまたは送信ボタンを右クリックし、[検証] を選択します。
右側に要素パネルが表示され、要素が強調表示されます。通常、この要素は次のいずれかです。
ユーザー名およびパスワード フィールドの場合は
<input>送信フィールドの場合は
<button>
コードの強調表示された要素を右クリックし、[Copy] > [Copy selector] の順に選択します。
admin.atlassian.com で適切なフィールドに貼り付けます。
フォーム認証が失敗する場合
セレクターが現在のログイン ページと一致していることを再確認してください。
ご利用のサイトで動的な ID やクラスを使用している場合は、より一般的なセレクターを試すか、Web 開発者にご相談ください。
Web サイトに接続してクロールする
アトラシアンの管理でカスタム Web サイトのセットアップ画面を開きます。
Go to Atlassian Administration. Select your organization if you have more than one.
[アプリ] > [コネクタ] の順に選択します。
複数のサイトがある場合は、接続するサイトを選択してから [コネクタを追加] を選択します。
[カスタム Web サイト] を選択して [次へ] を押します。
クロールをセットアップします。
クロール対象のサイトの Web サイト名を入力します。
ドメインの完全な URL を追加します。プロトコル (
https://) を含めてください。Teamwork Graph によるサイトのインデックス化の頻度を選択します。
認証方法を選択し、該当するフィールドに入力します。
データの使用に関する情報を確認して同意します。
[Connect] を選択します。
トラブルシューティング
サイトへの接続に問題がある場合は、robots.txt ファイルの編集が必要となる場合があります。アクセスの問題が解決しない場合は、サイトのファイアウォールが接続をブロックしている可能性があります。
修正案: robots.txt に atlassian-bot を追加する
接続に問題がある場合は、ご利用の Web サイトで robots.txt ファイルの編集が必要となる場合があります。robots.txt ファイルに関する知識が不足している場合は、robots.txt ファイルの書き方を参照するか、Web サイトの管理者にお問い合わせください。
Web サイトの既存の robots.txt ファイルに、次の行を追加する必要があります。
User-agent: atlassian-botクロール対象の Web サイトがサブドメイン (https://support.vitafleet.com/ など) である場合、robots.txt ファイルはドメインではなく、そのサブドメイン (https://support.vitafleet.com/robots.txt) にある必要があります (https://www.vitafleet.com/robots.txt の編集は機能しません)。
この atlassian-bot 編集を含め、ご自身の robots.txt ファイルは常に一般に公開されていることに注意してください (サイトで認証が必要な場合を除く)。
インデックス化されるコンテンツを制限する
atlassian-bot を robots.txt に追加すると、特定の許可または拒否ルールも追加できます。なお、コネクタはこれらのルールに従います。次に例を示します。
User-agent: atlassian-bot
Disallow: /not-useful/このルールでは、Teamwork Graph に対して、/not-useful/ にあるコンテンツを除き、ご利用のサイトのすべてのページをインデックス化することを許可します。
As an alternative, you may also consider using HTML tags to keep specific pages out of the index. For example:
<meta name="robots" content="noindex">This code should be added to the pages you don’t want included in the ingestion.
サイトにファイアウォールがある場合の対処法
一部のサイトでは、不明な IP からの接続をブロックします。ファイアウォールの許可リストにアトラシアン IP を追加するには、Web サイト管理者に相談しなければならない場合があります。これらの IP は以下の両方に記載されています。
https://ip-ranges.atlassian.com/ の動的なリスト (具体的には、
productがrovo-crawlerである IP)
これらの IP をファイアウォールの許可リストに追加したあと、コネクタの設定を再度試せます。
次のステップ
クロールのセットアップが完了したら、次の手順に従います。
サイトのクロールとインデックス化はすぐに開始されます。
ぺージは、数時間かけて徐々に自身とチームの検索に表示されるようになります。
Web サイトのぺージ数によっては、Web サイトのすべてのコンテンツがインデックス化されて検索に表示されるまでに時間がかかる場合があります。
この内容はお役に立ちましたか?