Quantcast
Channel: Haruhiko Okumura(@h_okumura) - Twilog
Viewing all articles
Browse latest Browse all 3414

10月22日のツイート

$
0
0

RT @alfredplpl: LLM-jp-13Bの学習(LoRA)のテスト用にずんだもんの設定を詰め込んだシンプルずんだもんデータセットを公開しました。東北企業を応援することにも使ってください。 huggingface.co/datasets/alfre… twitter.com/alfredplpl/sta…

posted at 07:59:57

RT @FumiharuKato: 大学入試の数学の採点では「…基本的には高校数学の範囲を逸脱する概念や定理などを用いて入試問題を解いても、それによって減点されることはまずありません。」 note.com/katobungen/n/n… より(著者自身による)引用

posted at 07:51:12

RT @rasbt: "But why is the transformer architecture designed as it is?" I came across an intriguing discussion this morning and wanted to share my perspective. I believe that transformers and multi-head self-attention were directly inspired by Bahdanau attention from 2014. RNNs had… twitter.com/i/web/status/1… pic.twitter.com/pAr1RJwyQ2

posted at 07:48:18


Viewing all articles
Browse latest Browse all 3414

Trending Articles