(株)ＰＫＳＨＡＴｅｃｈｎｏｌｏｇｙ【3993】の掲示板 2024/03/28〜2024/04/10

420

社会の様々な問題解決に貢献する
　　PKSHA technology🍀

先日の Ret Net LLM 開発の発表は
当初私と同じ様に
Ret Net に関する知識情報を
認知していない方が多かったのかも？

２０２３年に出された
PKSHA LLMS もそうでしたが
これから実際に
多くの企業で取り入れられ事により
その実力発揮👌

企業業務の効率化から
業績向上に貢献しますね🤗

何と言ってもこれまでのLLM の
３倍速かつ高性能と言う事なので👍

😤「世の中のアナリストさん
　　　　どこ見てんのよ!」

,,, って感じかな😅👌

開く

421
makoto2014 3月31日 13:37

>>420

昨年のRetNetに関する最初の論文

arXiv:2307.08621 (cs)
[Submitted on 17 Jul 2023 (v1), last revised 9 Aug 2023 (this version, v4)]

Retentive Network: A Successor to Transformer for Large Language Models

Yutao Sun, Li Dong, Shaohan Huang, Shuming Ma, Yuqing Xia, Jilong Xue, Jianyong Wang, Furu Wei

この論文の要約解説で比較的丁寧な記事がありましたので、ご参考まで。それでも、AI技術者でないと難解でしょうね。

note.com/daichi_mu/n/n1178f229c912" rel="nofollow">https://note.com/daichi_mu/n/n1178f229c912

https://youtu.be/B_iGSeG04qo

この記事の筆者感想が私には参考になりました。
ーーーーーーーーーーーーーーーーーーー

RetNetが特徴的なのは、「retentionモジュール」という部分を使っている点です。
このモジュールは、従来のTransformerとリカレントニューラルネットワーク（RNN）、そしてスライディングウィンドウ注意という3つの要素を組み合わせています。

具体的には、RetNetでは文章を解析する際に、それまでに登場した単語や情報を適切に保持しながら、新しい情報を取り入れることができます。
これにより、文章全体の意味をより正確に理解することができます。

RetNetの利点としては、訓練（学習）する際だけでなく、実際に文章を解釈する（推論する）際にも非常に効率的に動作するという点が挙げられます。
これにより、大量の文章を高速に処理することが可能となります。

従来のTransformerには、計算の複雑さが問題になることがありましたが、RetNetではその問題を回避できます。
また、リカレントニューラルネットワークの低コストな推論も取り入れることで、より効率的な処理が実現できるのです。

RetNetは、言語モデルの分野で新たな進化をもたらすと期待されており、さまざまな自然言語処理タスクにおいて優れた性能を発揮する可能性があります。

この文章は「RetNet A Successor to Transformer for Large Language Models Explained」という論文についての要約です。
この論文では、新しいモデル「RetNet」が提案されており、それがどのように従来のTransformerや他のモデルと比較されるかについて説明しています。

先行の研究と比べてRetNetの特徴は、「retention」モジュールを導入している点です。
このモジュールは、Transformer、リカレントニューラルネットワーク（RNN）、スライディングウィンドウ注意を組み合わせており、文章全体の情報を保持しつつ効率的に処理することができるようになっています。

RetNetの技術や手法の肝は、グループ規範と位置エンコーディングの導入です。
グループ規範は従来のソフトマックス関数を置き換えることで、クアドラティックな複雑性を回避しています。位置エンコーディングは、トークンの相対的な位置を考慮するために導入されています。

RetNetの有効性は、推論コストやトレーニングの並列化、メモリ効率などの観点から他のモデルと比較して検証されています。
さまざまな言語モデリングタスクにおいて、RetNetが高い性能を示していることが報告されています。

https://note.com/daichi_mu/n/n1178f229c912 https://youtu.be/B_iGSeG04qo この記事の筆者感想が私には参考になりました。ーーーーーーーーーーーーーーーーーーー RetNetが特徴的なのは、「retentionモジュール」という部分を使っている点です。このモジュールは、従来のTransformerとリカレントニューラルネットワーク（RNN）、そしてスライディングウィンドウ注意という3つの要素を組み合わせています。具体的には、RetNetでは文章を解析する際に、それまでに登場した単語や情報を適切に保持しながら、新しい情報を取り入れることができます。これにより、文章全体の意味をより正確に理解することができます。 RetNetの利点としては、訓練（学習）する際だけでなく、実際に文章を解釈する（推論する）際にも非常に効率的に動作するという点が挙げられます。これにより、大量の文章を高速に処理することが可能となります。従来のTransformerには、計算の複雑さが問題になることがありましたが、RetNetではその問題を回避できます。また、リカレントニューラルネットワークの低コストな推論も取り入れることで、より効率的な処理が実現できるのです。 RetNetは、言語モデルの分野で新たな進化をもたらすと期待されており、さまざまな自然言語処理タスクにおいて優れた性能を発揮する可能性があります。この文章は「RetNet A Successor to Transformer for Large Language Models Explained」という論文についての要約です。この論文では、新しいモデル「RetNet」が提案されており、それがどのように従来のTransformerや他のモデルと比較されるかについて説明しています。先行の研究と比べてRetNetの特徴は、「retention」モジュールを導入している点です。このモジュールは、Transformer、リカレントニューラルネットワーク（RNN）、スライディングウィンドウ注意を組み合わせており、文章全体の情報を保持しつつ効率的に処理することができるようになっています。 RetNetの技術や手法の肝は、グループ規範と位置エンコーディングの導入です。グループ規範は従来のソフトマックス関数を置き換えることで、クアドラティックな複雑性を回避しています。位置エンコーディングは、トークンの相対的な位置を考慮するために導入されています。 RetNetの有効性は、推論コストやトレーニングの並列化、メモリ効率などの観点から他のモデルと比較して検証されています。さまざまな言語モデリングタスクにおいて、RetNetが高い性能を示していることが報告されています。" />
- 返信数 1
- そう思う42
- そう思わない0
開く

(株)ＰＫＳＨＡＴｅｃｈｎｏｌｏｇｙ【3993】の掲示板 2024/03/28〜2024/04/10

情報・通信業カテゴリその他のスレッド

最近見たスレッド

株式カテゴリ
アクセスランキング

新着スレッド

この銘柄を見た人はこんな銘柄も見ています

情報・通信業カテゴリ その他のスレッド

最近見たスレッド

株式カテゴリ アクセスランキング

新着スレッド

この銘柄を見た人はこんな銘柄も見ています

情報・通信業カテゴリその他のスレッド

株式カテゴリ
アクセスランキング