usomaru技術ぶろぐ

学んだことをちょこちょこメモ( ..)φ

【雑談】ChatGPTでPDF分割とCognitive Search にインデックス作成までのスクリプトをつくった

半分雑談です。 仕事でAzure Cognitive SearchとAzure Open AIを使ってPDFの資料を検索できないか調査をしているのですが、こちらのGitHubを参考にしていました。 github.com ですが、スクラッチの開始の手順通りに進めてもうまくできず… 会社のサブスクリプ…

【Azure AI Document Intelligence(旧Form Recognizer)】カスタムモデルを試してみた

はじめに Document Intelligenceのカスタムモデルの調査と実際に試してみたため、その内容をまとめています。 カスタムモデルとは Document Intelligenceには請求書や領収書など、すでに学習されたモデルが存在します。 ですが、このモデルには存在しない項…

【.NET6 C#】Program.csについての理解を深める

はじめに .NET6になってStartup.csがなくなりProgram.csに統合されました。 そこで改めてProgram.csで何をやっているのかといつも設定してる内容を備忘録的にまとめました。 ※ASP.NET Core Web APIで作成した場合の例を載せています。 環境 いつも通り Visua…

Azure Open AI Service の On Your Dataを試してみる

はじめに 仕事でAzure Open AI Service On Your Dataに関して調査する機会があったので、調べたことをまとめています。 そもそもOn Your Dataとは チャット検索をユーザー独自のデータを対象にして実行できるようになるというものです。 ファイル検索にはAzu…

Azure AI Document Intelligence(旧Form Recognizer)の請求書モデルで取得できる項目についてまとめ

はじめに 前回請求書モデルを使ってAI-OCRのできるWebAPIをさくっと作りました。 usomarutech.com そのときのデータ加工をしていたコードの中身と特有のクラスについてまとめます。 ソースコード public async Task<AnalyzeData> GetAnalysisOfInvoiceData(IFormFile invo</analyzedata>…

Azure AI Document Intelligence(旧Form Recognizer)を使って請求書をAI-OCRできるWebAPIを作成

はじめに ずっと「Form Recognizer」って呼んでいたのですが、いつの間にか名前が変わってました… こちらDocument Intelligence Studioを使うと、Resultで返却されるJSONの項目数が半端ないので、OCRしたいファイルを送ると必要な項目だけすっきりと返却され…