カスタム Web サイトを Rovo に接続する

このコネクタを使用すると、Web サイトの検索クロールとインデックス化を実行して、Rovo 検索の結果に表示したり、Rovo チャットやエージェントで使用したりできます。

何がインデックス化されますか?

カスタム Web サイト コネクタは、次のオブジェクトをインデックス化します。

  • Web ページ (MIME タイプ: text/html)

  • テキスト ファイル (MIME タイプ: text/plain)

各オブジェクトについて、次の属性がインデックス化されます。

  • 名前

  • URL

  • createdDate

  • 最終更新日

  • 説明

  • ページ コンテンツ

はじめる前に

  • このコネクタは、お客様が所有するセキュアな (https) Web サイトのみをクロールできます。

  • We encourage you to review the pages that are available on your website. All Rovo users will have access to all content available to the crawler (including content using any configured authentication).

認証オプション

このコネクタは、現在、以下のサイトのクロールをサポートしています。

  • 認証なし (公開サイト)

  • 基本認証 (ユーザー名/パスワード、ログイン ページなし)

  • Form authentication (a login page requiring a username/password)

Basic and form authentication are suitable when your organisation has sites that aren’t public, but also don’t require individual permissions (for example, some intranets or internal knowledge bases).

You will still need to edit the robots.txt file on your authenticated site.

幅広いコンテンツへのアクセス

Connecting a site with authentication means that every Rovo user on your site can access all content available to the provided username and password.

Rovo では、このサイトの個別の権限を考慮しません。

Form authentication

To setup form authentication, you’ll need to get some details about the login form you see on your website.

  • Login URL: This is the URL where the user would see a login screen. It can be a subdomain or a different URL to the Domain URL. It must start with https://.

  • 4 selector fields:

    • Username selector: Input field where the user would type in their username

    • Password selector: Input field where the user would type in their password

    • Username submit selector (optional): If the password field is not visible initially on the login screen, this is the button that the user has to press after entering a username. An example is the Atlassian login screen (you may need to open this in an incognito window to see).

    • Password submit selector: The button to submit the username and password

What are selector fields?

Selectors identify the username and password fields in the webpage’s code to enable the connector to log in to your site.

Some example valid selectors are:

  • #email

  • #password

To set up form-based authentication, you’ll need to copy and fill in at least three selectors (username, password, and password submit) to setup form authentication.

How to find the selectors from your site

How to find your site's selector using the Inspect tool

To copy the selectors for your login screen from Chrome:

  1. Open your Login URL in a non-logged-in browser (or an incognito window).

  2. Right-click the applicable text box or the submit button, then select Inspect.

  3. An elements panel will appear on the right side, with an element highlighted. This element is usually:

    1. <input> for the username and password fields

    2. <button> for the submit fields

  4. Right-click on the highlighted element of the code, and select Copy > Copy selector.

  5. Paste it into the appropriate field in admin.atlassian.com.

If form authentication is failing

  • Double-check that the selectors match the current login page.

  • If your site uses dynamic IDs or classes, try a more general selector or consult your web developer.

Web サイトに接続してクロールする

アトラシアンの管理でカスタム Web サイトのセットアップ画面を開きます。

  1. Go to Atlassian Administration. Select your organization if you have more than one.

  2. [アプリ] > [AI 設定] > [Rovo] の順に選択します。

  3. [サイト] で、接続するサイトの横にある [コネクタを追加] を選択します。

  4. [カスタム Web サイト] を選択して [次へ] を押します。

クロールをセットアップします。

  1. クロール対象のサイトの Web サイト名を入力します。

  2. ドメインの完全な URL を追加します。プロトコル (https://) を含めてください。

  3. Select how often Rovo should index your site.

  4. Select your authentication method and fill in any applicable fields.

  5. データの使用に関する情報を確認して同意します。

  6. [Connect] を選択します。

トラブルシューティング

サイトへの接続に問題がある場合は、robots.txt ファイルの編集が必要となる場合があります。アクセスの問題が解決しない場合は、サイトのファイアウォールが接続をブロックしている可能性があります。

修正案: robots.txt に atlassian-bot を追加する

If you’re having issues connecting, you may need to be able to edit the robots.txt file on your website. If you’re not sure what a robots.txt file is, see How to write a robots.txt file, or talk to your website administrator.

Web サイトの既存の robots.txt ファイルに、次の行を追加する必要があります。

User-agent: atlassian-bot

クロール対象の Web サイトがサブドメイン (https://support.vitafleet.com/ など) である場合、robots.txt ファイルはドメインではなく、そのサブドメイン (https://support.vitafleet.com/robots.txt) にある必要があります (https://www.vitafleet.com/robots.txt の編集は機能しません)。

この atlassian-bot 編集を含め、ご自身の robots.txt ファイルは常に一般に公開されていることに注意してください (サイトで認証が必要な場合を除く)。

インデックス化されるコンテンツを制限する

atlassian-bot を robots.txt に追加すると、特定の許可または拒否ルールも追加できます。なお、コネクタはこれらのルールに従います。次に例を示します。

User-agent: atlassian-bot Disallow: /not-useful/

このルールでは、Rovo に対して、/not-useful/ にあるコンテンツを除き、ご利用のサイトのすべてのページをインデックス化することを許可します。

サイトにファイアウォールがある場合の対処法

一部のサイトでは、不明な IP からの接続をブロックします。ファイアウォールの許可リストにアトラシアン IP を追加するには、Web サイト管理者に相談しなければならない場合があります。これらの IP は以下の両方に記載されています。

これらの IP をファイアウォールの許可リストに追加したあと、コネクタの設定を再度試せます。

次のステップ

クロールのセットアップが完了したら、次の手順に従います。

  1. サイトのクロールとインデックス化はすぐに開始されます。

  2. ぺージは、数時間かけて徐々に自身とチームの検索に表示されるようになります。

  3. Web サイトのぺージ数によっては、Web サイトのすべてのコンテンツがインデックス化されて検索に表示されるまでに時間がかかる場合があります。

さらにヘルプが必要ですか?

アトラシアン コミュニティをご利用ください。