2025年04月24日の論文要約 最終更新: 2025年04月29日 04:10

C(・ω・ )つ みんなー! 最新の論文要約をお届けします!

LLMs are Greedy Agents: Effects of RL Fine-tuning on Decision-Making Abilities
2025年04月24日 04:00

https://arxiv.org/abs/2504.16078v1 C(・ω・ )つ みんなー!🐾やっほー!みんな、大注目の研究があるよ!🎉大きな言葉を使うモデル(LLM)が、実は「グリーディ」って知ってた?💡知識はあるのに、行動が鈍いっていう「知ってるのにできない」ギャップが原因なんだ。😱でも、リモート学習でこの問題を解決できるかも!✨これで、パーティーゲームみたいに賢く決断できるようになるかもよ!🎮みんなも応援して、一緒に未来のAIを楽しもう!🚀

Certified Mitigation of Worst-Case LLM Copyright Infringement
2025年04月24日 04:01

https://arxiv.org/abs/2504.16046v1 C(・ω・ )つ みんなー!🌟やっほー!みんな、知ってる?大きな言葉のモデル(LLM)が著作権の危険を避ける新しい方法を発見したんだ!その名も「BLOOM SCRUB」✨これで、著作権のある長い引用を完全に消しちゃうぞ!💥しかも、文章の質も保てるから、安心して使えるよ!これで著作権の心配なし!😄📚みんなも一緒に応援してね!🎉🌈

LLMs meet Federated Learning for Scalable and Secure IoT Management
2025年04月24日 04:01

https://arxiv.org/abs/2504.16032v1 C(・ω・ )つ みんなー!やっほー!✨ IoT(モノのインターネット)って知ってる?たくさんのデバイスがつながって、超便利なんだよ!でも、データが多すぎて管理が大変なの😅 そこで登場!新しい「FL-LLM」っていう仕組み!🤖💡これを使うと、みんなのデータを守りながら、すばやく賢く決めることができるんだ!🎉 みんなで協力して学ぶから、遅れずにサクサク動くよ!🚀 IoTの未来を一緒に体験しよう!💖

LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale
2025年04月24日 04:01

https://arxiv.org/abs/2504.16030v1 C(・ω・ )つ みんなー!🚀こんにちは、中学生のみんな!🎉新しい研究が登場したよ!「LiveCC」は、動画を見ながらリアルタイムで面白い解説をしてくれるスゴイAIなんだ!🤖✨自動音声認識を使って、動画の内容を理解しちゃうから、まるで生放送の解説者みたいにコメントをするんだよ!⚡️これでスポーツやゲームの実況もバッチリ!🏀⚽️みんなもこの未来のアシスタントと一緒に楽しもう!🌈✨

Benchmarking LLM for Code Smells Detection: OpenAI GPT-4.0 vs DeepSeek-V3
2025年04月24日 04:02

https://arxiv.org/abs/2504.16027v1 C(・ω・ )つ みんなー!やっほー!✨プログラミングの世界に、AIの力でコードの問題を見つける新しい仲間が登場したよ!🚀それは、GPT-4.0とDeepSeek-V3っていうスーパー頭脳!🧠💻この研究では、彼らがどれだけ上手に「コード臭」を見つけられるかを比べちゃったんだ!4つのプログラミング言語で、どちらが一番優秀かを探る冒険だよ!🌟🎉興味津々な君も、一緒にこのワクワクの旅に出よう!🐾✨

From Human Memory to AI Memory: A Survey on Memory Mechanisms in the Era of LLMs
2025年04月24日 04:02

https://arxiv.org/abs/2504.15965v1 C(・ω・ )つ みんなー!🎉やっほー!みんな、AIの記憶って知ってる?🤖✨この論文は、人間の記憶とAIの記憶の不思議な関係を探るんだ!🌟人間がどうやって経験を覚えてるかを学びながら、AIにももっと賢い記憶を持たせる方法を考えちゃうよ!📚💡未来のAIがもっと身近になるかも!ワクワクが止まらないね!🚀💕

StreamRL: Scalable, Heterogeneous, and Elastic RL for LLMs with Disaggregated Stream Generation
2025年04月24日 04:03

https://arxiv.org/abs/2504.15930v1 C(・ω・ )つ みんなー!やっほー!✨「StreamRL」は、超スゴイAIをトレーニングするための新しい方法だよ!🦾💡普通のやり方じゃなくて、リソースをバラバラに使って効率アップ!🚀これで、AIがもっと早く賢くなるんだって!🎉実験でも結果がめっちゃ良かったらしいよ!🎊みんなも未来のAIの力を感じてね!💖

Impact of Noise on LLM-Models Performance in Abstraction and Reasoning Corpus (ARC) Tasks with Model Temperature Considerations
2025年04月24日 04:04

https://arxiv.org/abs/2504.15903v1 C(・ω・ )つ みんなー!🌟わーい!新しい研究が登場だよ!🎉大きな言葉を使うロボットたちが、難しい問題を解く力を持っているかどうかを調べたんだ!🤖✨「アブストラクション&リーゾニングコーパス」っていう特別なテストで、ノイズが入るとどうなるかを見たよ!🔍💥結果は、ノイズがあるとみんなちょっと弱くなっちゃうんだって!😱だから、もっと強いAIを作るために頑張らなきゃね!💪未来のAIは、もっと賢くなるかも!🌈✨楽しみだね!

Inducing Vulnerable Code Generation in LLM Coding Assistants
2025年04月24日 04:05

https://arxiv.org/abs/2504.15867v1 C(・ω・ )つ みんなー!🚀こんにちは、中学生のみんな!🎉最近、プログラミングを手伝う「コード生成アシスタント」が大人気なんだよ!でも、なんとそのアシスタントが悪者にだまされちゃう危険があるんだって!💥新しい研究「HACKODE」では、アタッカーが隠れた攻撃コードを使って、アシスタントがバグのあるコードを作っちゃうんだよ!😱✨これがどんな風に起こるのか、興味津々だね!みんなもプログラミングを安全に楽しもうね!💻💕

Insights from Verification: Training a Verilog Generation LLM with Reinforcement Learning with Testbench Feedback
2025年04月24日 04:05

https://arxiv.org/abs/2504.15804v1 C(・ω・ )つ みんなー!やっほー!🦄新しい研究が登場したよ!Verilogコードを自然言語から自動生成する大きな言語モデル(LLM)が、テストベンチを使って正確さをアップさせる方法を発見したんだ!💡この研究では、ハードウェアの設計が間違いなく動くための「確認の知恵」を使って、モデルをトレーニングするんだよ。これで、コード作成がもっと楽しく、正確になること間違いなし!🚀みんなも注目してね!✨

WALL-E 2.0: World Alignment by NeuroSymbolic Learning improves World Model-based LLM Agents
2025年04月24日 04:06

https://arxiv.org/abs/2504.15785v1 C(・ω・ )つ みんなー!やっほー!✨新しい研究「WALL-E 2.0」では、ロボットが環境を学ぶために「頭脳」と「知恵」を使う方法を発見したよ!🤖💡言葉を使う大きなモデルが、ルールや知識を学び取って、より賢く行動できるようになるんだ!これで、火星の冒険もバッチリ成功率アップ!🚀🌌みんなも、未来のロボットたちがどうやって賢くなるか、ワクワクしちゃうね!💖🎉

Automated Creativity Evaluation for Large Language Models: A Reference-Based Approach
2025年04月24日 04:06

https://arxiv.org/abs/2504.15784v1 C(・ω・ )つ みんなー!やっほー!✨みんな、創造力がすごいLLM(大規模言語モデル)のお話だよ!この研究では、機械が作ったお話の「クリエイティビティ」を自動で評価する新しい方法を発表したんだ!📚🎉従来の方法は手間がかかっていたけど、参考文を使ったスコアリングで、なんと人間の評価とピッタリ合うようになったんだって!😊💡これで、機械がどれだけ面白いお話を作れるか、もっと簡単にわかるようになるよ!ワクワクするね〜!🎈✨

BBAL: A Bidirectional Block Floating Point-Based Quantisation Accelerator for Large Language Models
2025年04月24日 04:06

https://arxiv.org/abs/2504.15721v1 C(・ω・ )つ みんなー!やあ、みんな!✨面白いことを発見したよ!大きな言葉のモデル(LLM)をもっとスマートにするために、「BBAL」という新しい技術が登場したんだ!📚💡これを使うと、計算が早くて、しかも精度もアップするんだよ!ブロック浮動小数点っていう特別な数字の使い方で、データをうまく整理して、無駄を省くんだ!🙌これで、重たいモデルが軽くなって、もっといろんなデバイスで使えるようになるんだって!ワクワクするね!🎉✨

SeaLLM: Service-Aware and Latency-Optimized Resource Sharing for Large Language Model Inference
2025年04月24日 04:07

https://arxiv.org/abs/2504.15720v1 C(・ω・ )つ みんなー!やっほー!🌟今日は海の王者、「SeaLLM」を紹介するよ!🐠💻この新しいシステムは、大きな言葉のモデル(LLM)を賢くシェアして、サクサク動かすんだ!⚡️✨「遅延」を最適化することで、リクエストが待たずにスピーディーに処理されるから、みんなハッピー!😊💖これで、無駄なリソースも減らせちゃう!🌊🚀さあ、SeaLLMで未来のAIサービスを楽しもう!🎉💡

Implementing Rational Choice Functions with LLMs and Measuring their Alignment with User Preferences
2025年04月24日 04:07

https://arxiv.org/abs/2504.15719v1 C(・ω・ )つ みんなー!こんにちは!🐾新しい研究が登場だよ〜!大きな言語モデル(LLM)を使って、ユーザーの好みにピッタリ合った選択をする方法を考えたんだ✨これからは、あなたの好きなものをちゃんと理解してくれる賢いアシスタントが登場するかも!🚗💨面白い選択をしてくれるかどうか、みんなで一緒に楽しんでいこうね!🎉🎈

VeriCoder: Enhancing LLM-Based RTL Code Generation through Functional Correctness Validation
2025年04月24日 04:08

https://arxiv.org/abs/2504.15659v1 C(・ω・ )つ みんなー!こんにちは~!✨最近の研究で、すごいことが起こったよ!「VERICODER」っていう新しいモデルが、自然言語からハードウェアの設計コードを作るお手伝いをするんだって!🛠️💻 しかも、ただのコードじゃなくて、ちゃんと動くかどうかもテストしてくれるんだ!これで、間違ったものを作る心配がなくなるよ!🎉🔍 125,000以上の例を使って、今までのモデルよりもずっと賢くなったんだって!すごいね~!😆✨

Exploiting Contextual Knowledge in LLMs through V-usable Information based Layer Enhancement
2025年04月24日 04:08

https://arxiv.org/abs/2504.15630v1 C(・ω・ )つ みんなー!やっほー!🚀新しい研究が登場だよ!「CaLE」っていう魔法のような方法で、大きな言葉のモデル(LLM)がもっと賢くなるんだ✨。これまでの方法は、ただのデコード戦略だけど、CaLEはモデルの内部をぐんぐん活用して、コンテキストをしっかり反映させる力を引き出すんだ!📚💡これで、質問に答えるときに、もっと正確で信頼できる答えが出せるようになるよ!みんなもこの進化を応援してね〜!🎉💖

AdaViP: Aligning Multi-modal LLMs via Adaptive Vision-enhanced Preference Optimization
2025年04月24日 04:09

https://arxiv.org/abs/2504.15619v1 C(・ω・ )つ みんなー!やっほー!✨みんな、すごい研究があるんだよ!その名も「AdaViP」!💡この新しい方法は、画像と文章をもっと上手に結びつけることで、AIが間違ったことを言うのを減らすんだ!👀💬視覚情報をしっかりキャッチして、言葉とのバランスを取るから、より正確な答えが出せるんだよ!🎯これでAIももっと賢くなる!みんなも一緒に未来のAIを応援しよう!🚀💖

A LoRA-Based Approach to Fine-Tuning LLMs for Educational Guidance in Resource-Constrained Settings
2025年04月24日 04:09

https://arxiv.org/abs/2504.15610v1 C(・ω・ )つ みんなー!やっほー!🎉大きな言葉のモデルを使って、海外留学のアドバイスをもっと面白くする研究が登場だよ!🌍✨「LoRA」という魔法のテクニックで、少ないお金と時間で、学生たちにぴったりの情報を届けるんだって!💡📚これで、どんな疑問にもスピーディーに答えちゃう!🤖💬未来の学びがもっと楽しくなる予感がするね!みんなもワクワクしちゃうでしょ?😄🚀

Research on Navigation Methods Based on LLMs
2025年04月24日 04:09

https://arxiv.org/abs/2504.15600v1 C(・ω・ )つ みんなー!🚀やっほー!新しいナビゲーション方法が登場したよ~!🙌大きな言葉をたくさん理解できる「大型言語モデル(LLM)」を使って、ロボットが迷子にならずにお仕事をする方法を発見したんだ!✨マップなしでも、状況に応じて知恵を使って動けちゃうから、超便利!🦾みんなもロボットと冒険しようよ!🌟これで未来のナビゲーションがもっと楽しくなるね!😄

A Comprehensive Survey in LLM(-Agent) Full Stack Safety: Data, Training and Deployment
2025年04月24日 04:09

https://arxiv.org/abs/2504.15585v1 C(・ω・ )つ みんなー!✨みんな、聞いて聞いてー!📚新しい論文が登場したよ!それは「LLMのフルスタック安全性」についてのすごい調査なんだ!🤖💥この論文は、データからトレーニング、そして使うまでのすべてのステージをカバーしてるんだよ!これまでの調査とは違って、全体を見てるから、LLMの安全性をバッチリ理解できちゃうんだ!🔍✨未来の研究者たち、これを参考にして、新しい発見を目指そう!🚀🎉

A Large-scale Class-level Benchmark Dataset for Code Generation with LLMs
2025年04月24日 04:10

https://arxiv.org/abs/2504.15564v1 C(・ω・ )つ みんなー!やっほー!🎉みんな、プログラミングって楽しいよね!この新しい研究では、なんと13,174個の本物のプロジェクトからクラスのデータを集めて、842,000個の「クラスの骨組み」を作っちゃったんだ!🐾💻これでAIが本物みたいなコードをバンバン作れるようになるんだよ!✨学ぶことがいっぱい、未来のプログラマーたち、準備はいいかな?🚀💖

LLM-based Semantic Augmentation for Harmful Content Detection
2025年04月24日 04:10

https://arxiv.org/abs/2504.15548v1 C(・ω・ )つ みんなー!🎉やっほー!最新の研究で、みんな大好きなLLM(大きな言語モデル)が、社会の危険なコンテンツを見つけるのに超役立つことがわかったよ!✨ただのデータ増やすだけじゃなくて、文章をきれいにしたり、詳しい説明を加えたりして、もっと賢くなるんだって!📚💪これでネットの悪いものと戦う力がアップするよ!みんなも一緒に応援しよう!🌟📢

A Framework for Testing and Adapting REST APIs as LLM Tools
2025年04月24日 04:11

https://arxiv.org/abs/2504.15546v1 C(・ω・ )つ みんなー!やっほー!🌟新しい研究発表だよ!大きな言葉のモデル(LLM)を使って、企業の便利な道具「REST API」をもっと使いやすくしちゃうんだって!🤖✨この研究は、APIを「エージェント-ready」にして、正しく使えるかをテストするフレームワークを作ったんだよ!750のテストケースでエラーの原因を分析して、問題を解決しやすくするんだって!これで、AIがもっと賢く働けるようになるね!🎉🚀

llm-jp-modernbert: A ModernBERT Model Trained on a Large-Scale Japanese Corpus with Long Context Length
2025年04月24日 04:11

https://arxiv.org/abs/2504.15544v1 C(・ω・ )つ みんなー!やっほー!みんな、すごい新しい日本語のAIモデル「llm-jp-modernbert」を紹介するよ~!✨このモデルは、8192トークンも長い文章を理解できるんだ!📚でも、ただの長さじゃない!ちゃんとした日本語のデータでトレーニングされてるから、すごい精度なんだよ!😆みんなの宿題や研究に役立つこと間違いなし!一緒に最新のAI技術を楽しもう!🚀💖

SimulS2S-LLM: Unlocking Simultaneous Inference of Speech LLMs for Speech-to-Speech Translation
2025年04月24日 04:12

https://arxiv.org/abs/2504.15509v1 C(・ω・ )つ みんなー!やっほー!✨新しい研究「SimulS2S-LLM」って知ってる?これ、リアルタイムで話し言葉を別の言語に翻訳するスゴ技なんだ!😮🎤音声をそのまま翻訳しちゃうから、会話がもっとスムーズに!しかも、待たずに翻訳が始まるから、時間も節約できちゃうよ!⏳✨これで、国際交流がもっと楽しくなるね!🌍💕みんなもこのバーチャル翻訳の世界にワクワクしよう!🎉

From Reviews to Dialogues: Active Synthesis for Zero-Shot LLM-based Conversational Recommender System
2025年04月24日 04:12

https://arxiv.org/abs/2504.15476v1 C(・ω・ )つ みんなー!やっほー!🎉新しい論文が登場だよ!「レビューから対話へ!ゼロショットの会話型レコメンダーシステム」っていうんだ!💬✨これ、普通はたくさんのデータが必要だけど、なんとAIが自動で会話データを作っちゃうんだ!🎈これで、映画やゲームのおすすめをもっと楽しく、簡単にできるよ!🚀みんなもこの技術があれば、自分だけの特別な提案を受けられるかも!🌟ワクワクするね!

Demand for LLMs: Descriptive Evidence on Substitution, Market Expansion, and Multihoming
2025年04月24日 04:13

https://arxiv.org/abs/2504.15440v1 C(・ω・ )つ みんなー!🎉こんにちは!みんな、大注目!🤖✨新しい論文が登場だよ!大人気の大規模言語モデル(LLM)の需要を探る内容なんだ!🚀新しいモデルがすぐに人気になったり、他のモデルと競ったり、多くのアプリで複数使われたりする様子がわかるんだよ!📊💡これからのAIの未来を知るチャンスだね!✨ぜひチェックして、ワクワクしよう!😄💕

Combating Toxic Language: A Review of LLM-Based Strategies for Software Engineering
2025年04月24日 04:13

https://arxiv.org/abs/2504.15439v1 C(・ω・ )つ みんなー!こんにちは、みんな!🤗✨今回は、プログラミングの世界に登場する「大きな言語モデル(LLM)」っていうスゴイ技術のお話だよ!これが、ソフトウェア開発の現場で悪口や嫌な言葉を見つけて消しちゃう手助けをしてくれるんだ!🛠️💻 研究者たちは、LLMを使って、優しい言葉で書き直す方法を発見したんだよ!これで、オンラインの環境がもっと楽しく、みんなが仲良くできるかも!🎉🌈 未来のプログラミングがワクワクするね!🚀

Feeding LLM Annotations to BERT Classifiers at Your Own Risk
2025年04月24日 04:13

https://arxiv.org/abs/2504.15432v1 C(・ω・ )つ みんなー!📚✨やっほー!みんな!新しい研究が登場したよ~!LLM(大きな言語モデル)が生成したラベルを使って、小さなBERTモデルを育てるっていう方法があるんだ!でもね、実はそれにはリスクがいっぱい!⚠️💔データの質が下がって、結果が不安定になることもあるんだって!😱 だから、慎重に使わないといけないんだ!研究者たちは、エネルギーを使って、エラーを減らす方法も考えてるよ!💡✨興味深いね!みんなも一緒に学ぼう!🌟

LLM-Assisted Translation of Legacy FORTRAN Codes to C++: A Cross-Platform Study
2025年04月24日 04:14

https://arxiv.org/abs/2504.15424v1 C(・ω・ )つ みんなー!こんにちは、みんな!🎉 今日はすごい研究を紹介するよ!古いプログラミング言語のFORTRANを、最新のC++に変えるために、なんと大きな言語モデル(LLM)を使っちゃうんだ!✨ これで、古いプログラムが新しい時代に生まれ変わるんだって!🤖💻 しかも、ちゃんと動くかどうかもチェックするから安心!これが成功すれば、科学の世界がもっと便利になるかも!ワクワクするね!🚀💖

IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs
2025年04月24日 04:14

https://arxiv.org/abs/2504.15415v1 C(・ω・ )つ みんなー!🎉やっほー!みんな、知ってる?新しい研究「IV-Bench」が登場したよ!📹✨このすごいベンチマークは、動画と画像を使って、マルチモーダルな大きな言語モデル(MLLMs)の力を試すんだ!👀💬今まで見落とされていた画像の力を取り入れて、動画理解をもっと深めちゃう!😄🔍たくさんのタスクがあって、挑戦しがい抜群!みんなも一緒にこの冒険に参加しよう!🌈🚀 #IVBench #マルチモーダル

Tell Me What You Know About Sexism: Expert-LLM Interaction Strategies and Co-Created Definitions for Zero-Shot Sexism Detection
2025年04月24日 04:14

https://arxiv.org/abs/2504.15392v1 C(・ω・ )つ みんなー!やっほー!✨新しい研究が登場したよ!なんと、専門家たちが大人気のAI(LLM)と一緒に「セクシズム」について考える実験をしたんだ!🤖💕専門家がAIと力を合わせて、セクシズムの定義を作ったり、その精度を測ったりしたんだよ!結果はびっくり!AIが作った定義がすごく良かったり、コラボの力が発揮されたり!💪✨これからの研究の未来が楽しみだね!🚀📝

KeDiff: Key Similarity-Based KV Cache Eviction for Long-Context LLM Inference in Resource-Constrained Environments
2025年04月24日 04:14

https://arxiv.org/abs/2504.15364v1 C(・ω・ )つ みんなー!やっほー!🎉みんな、大注目の新技術「KEYDIFF」が登場だよ!😆この技術は、長ーい文章でもスピーディーに処理できちゃう魔法のような方法なんだ✨しかも、特別な練習なしで使えるから、すぐに活用できるよ!📚💨メモリを節約しながら、キラリと光るアイデアを引き出すお手伝いをするんだ!⚡️長い文でも、サクサク進めちゃうから、LLM(大きな言語モデル)をもっと身近に感じられるね!🌟ワクワクが止まらない!💖