AI 30 4月 2023 ReazonSpeech 日本語に適した音声認識モデル・自動書き起こしAIを試してみた Whisperについて、高速化したfast-whisperについては、過去に記事を書いてきました。 今回は、ReazonSpeech(約19,000時間の放送音声からなるラベル付き日本語音声コーパス)を用いて文字起こしをして行きたいと思います。 ちなみに、精度に関してはWhisper Large-v… 続きを読む
AI 22 4月 2023 Dolly 2.0 + Hugging Face + googletrans LLMを翻訳機能と合わせてみた 前回の記事で、Dolly2.0が日本語を入力してもうまく応答してくれませんでした。Google翻訳の機能と合わせて応答の精度が向上するのか、試してみたいと思います。 (さらに…)… 続きを読む
AI 16 4月 2023 Dolly 2.0 + Hugging Face オープンソース+商用利用可能なLLM(Language Large Model)を試してみる オープンソースの商用利用可能なLLMのDolly 2.0が公開されましたので、Google Colaboratoryを使用して実際に試していこうと思います。Hugging Faceを通して公開されているため、簡単に使用することができます。 (さらに…)… 続きを読む
python 6 4月 2023 Python stweet+WordCloud Twitterのトレンドを可視化してみた Twitterの投稿内容をサードAPIで取得するライブラリstweetと、文中の出現頻度の高い単語を抽出して可視化するツールWordCloudを用いて、Twitterのトレンドを可視化してみました。 検索キーワードを変更することで、自分の取得したい情報を可視化して捉えることができるので、有用かと思い… 続きを読む
python 4 4月 2023 Python WordCloudを学習してみた WordCloudとは、文中の出現頻度の高い単語を抽出して可視化するツールです。日々の情報収集の結果を、視覚的に捉えるのには有効なツールと言えます。某情報番組では、毎日、番組の冒頭で紹介されていたので、見たことがある人も多いのでは。 公式サイトのサンプル画像を載せておきます。 (さらに&hellip… 続きを読む
python 2 4月 2023 Python Webスクレイピング 実践してみた③ 前回の記事(Webスクレイピング 実践②)の続きを記載してきます。 前回までに、実際にウェブサイトから情報を取得してCSVファイルに出力するまで学習しました。今回は、以下のようなパターンを想定して、Seleniumを使った方法を記載したいと思います。 Google、Yahooなどで、指定したキーワー… 続きを読む