掲載予定期間:2026/2/12(木)~2026/5/13(水)更新日:2026/2/12(木)

株式会社Unsung Fields

【横浜】推論システムエンジニア(LLM サービングランタイム + パフォーマンス)

New
正社員
転勤なし
求人詳細

気になるリストに保存しました

「気になるリストへ」のボタンから、気になるリスト一覧へ移動できます

仕事内容

【横浜】推論システムエンジニア(LLM サービングランタイム + パフォーマンス)

■業務内容:
当社の推論システムエンジニアとして、本番環境におけるLLM推論を支えるサービングランタイムを担当します。推論パイプライン全体を俯瞰して論理的に考え、厳密な計測に基づいて改善効果を検証し、本番環境レベルの慎重さと規律をもって運用いただきます。

■業務内容:
◇サービングランタイムのエンドツーエンドな挙動を担当
リクエストのライフサイクル管理、ストリーミンセマンティクス、キャンセル処理、リトライとの相互作用、タイムアウト設定、一貫した障害モードの設計・運用
◇バッチ処理およびスケジューリング戦略の設計・実装を担当
動的バッチ処理、アドミッションコントロール、複数テナントが混在する環境下での公平性、優先レーン、連鎖的障害を防ぐためのバックプレッシャー機構
◇システムレベルでの性能最適化
Time-to-first-tokenの短縮、テールレイテンシの安定化、tokens/secスループットの向上、現実的なワークロード下でのアクセラレータ利用効率の改善
◇メモリ挙動およびキャッシュ効率の改善
KVキャッシュのポリシー設計、フラグメンテーション制御、エビクション戦略、OOM(メモリ不足)やパフォーマンス低下を防ぐための安全策の設計。
◇ランタイム実行最適化の推進:オペレータ単位での改善、量子化手法の統合、必要に応じたコンパイル/チューニング経路、環境へのデプロイにおいて安定した性能を生み出すパラメータ設計
◇性能計測に関する規律の確立
再現可能なベンチマーク、現実的なトラフィックトレース、ワークフローのプロファイリング、回帰検知ゲート、本番での成果指標と連動したダッシュボード
◇システムへ本番運用に耐えうる仕組の組み込み
機能フラグを用いた段階的ロールアウト、カナリアリリース、安全な設定変更、MTTR(平均復旧時間)を短縮するインシデント対応手順書
◇ネットワーキングおよびインフラ運用チームと連携し、デプロイメントトポロジー、障害ドメイン、容量制約を性能および信頼性目標に適合させます。
◇プロダクトおよびAPIチームと協力し、サービングレイヤーの保証事項が外部インターフェースおよび顧客の期待に正確に反映されるよう確保します。

変更の範囲:会社の定める業務

対象となる方

<最終学歴>大学院、大学卒以上

<応募資格/応募条件>
■必須条件:
・高性能システムの構築経験5年以上(モデルサービング、GPU システム、パフォーマンスエンジニアリング、低レイテンシ分散システムなど)
・LLM 推論におけるトレードオフへの深い理解
・Python/C++スタックを横断して使用し、本番環境でのプロファイリング・デバッグツールを活用した業務に慣れている
・本番環境の変動や運用上の制約下でも持続する性能改善をリリースしてきた実績
・高いサイバーハイジーン意識に基づくエンジニアリング規律

勤務地

<勤務地詳細>
本社
住所:神奈川県横浜市西区みなとみらい2-3-1
受動喫煙対策:屋内全面禁煙
変更の範囲:会社の定める事業所

<転勤>

勤務時間

<勤務時間>
9:00~18:00 (所定労働時間:8時間0分)
休憩時間:60分
時間外労働有無:有

雇用形態

正社員


<雇用形態補足>
期間の定め:無

<試用期間>
3ヶ月

給与

<予定年収>
800万円~1,400万円

<賃金形態>
月給制

<賃金内訳>
月額(基本給):666,000円~1,166,000円

<月給>
666,000円~1,166,000円

<昇給有無>


<残業手当>


<給与補足>
■昇給:あり

賃金はあくまでも目安の金額であり、選考を通じて上下する可能性があります。
月給(月額)は固定手当を含めた表記です。

待遇・福利厚生

通勤手当、健康保険、厚生年金保険、雇用保険、労災保険

<各手当・制度補足>
通勤手当:月上限15,000円
社会保険:補足事項なし

<定年>
65歳

<教育制度・資格補助補足>

休日・休暇

週休2日制(休日は土日のみ)
年間有給休暇10日~(下限日数は、入社半年経過後の付与日数となります)
年間休日日数120日

会社概要

事業概要

■当社について:
当社は、ハードウェアの保守・運用だけでなく、
HPCサーバを利用するための独自のクラウドサービスを提供することでAI開発者のための究極の環境を提供しています。
日本とスリランカの技術を融合し、AI開発を加速させる最適な環境を提供することを目指しています

■事業内容:
・データセンター開発支援
・データセンター保守、運用
・データセンター向けクラウドサービス開発、運用

所在地

〒220-0012
神奈川県横浜市西区みなとみらい2-3-1

設立
2024年8月
従業員数
10名
上場市場名
非上場
資本金
3百万円

応募方法

応募方法

この求人情報は、dodaエージェントサービスの採用プロジェクト担当を通じての受付となります。

応募の流れ
  • 「応募依頼する」ボタンを押すと、ご応募と同時にdodaエージェントサービスの登録が完了します。
  • ご応募後、職務経歴書のアップロードがお済みでない方は、できる限りお早めにご提出をお願いします。
  • 採用条件に合致した方については、dodaエージェントサービスにご提出いただいた情報 にて、そのまま企業への応募手続きをいたします。
  • ご応募についての合否に関わるご連絡は、この求人情報を担当する採用プロジェクト担当から行います。
応募前・応募直後によくある質問

本求人よりご応募された場合、採用プロジェクト担当がサポートします。担当のキャリアアドバイザーを通じたサポートをご希望の場合は、その旨を記載のうえ、企業名と求人名を添えて、担当キャリアアドバイザーへご連絡ください。

お問い合わせフォームより、該当する企業名と求人名、またポートフォリオを提出されたい旨を記載のうえ、ご連絡ください。
求人情報を担当する採用プロジェクト担当より、改めてご連絡いたします。
※ご質問の種類は、「dodaエージェントサービスについて」をご選択ください。

お問い合わせフォームより、該当する企業名と求人名、また志望動機書や自己PRを提出したい旨を記載のうえ、ご連絡ください。
求人情報を担当する採用プロジェクト担当より、改めてご連絡いたします。
※ご質問の種類は、「dodaエージェントサービスについて」をご選択ください。

「選考準備中」とは、採用プロジェクト担当が、企業提出前に書類を確認している状態です。採用条件に合致しているか、およびキャリアシートやアップロードいただいた書類に不備がないかを確認しています。
なお、選考状況のご連絡がない場合、採用プロジェクト担当から、書類の修正依頼や応募時必要情報の確認についてメールをお送りしている場合もありますので、ご確認ください。

お問い合わせフォームより、該当する企業名と求人名、また質問事項を記載のうえ、ご連絡ください。
求人情報を担当する採用プロジェクト担当より、改めてご連絡を行います。
※ご質問の種類は、「dodaエージェントサービスについて」をご選択ください。

※海外企業が雇用元となる求人にご応募いただいた場合、当該国の提携会社の担当者からご連絡を行うことがあります。あらかじめご了承ください。

【拠点名】シンガポール:PERSOLKELLY Singapore Pte Ltd
香港:PERSOLKELLY Hong Kong Limited
韓国:PERSOLKELLY Korea, Ltd.
台湾:台灣英創管理顧問分有限公司
ベトナム:PERSOLKELLY Vietnam Company Limited
中国:英創人材服務(上海)有限公司、英創人力資源服務(深セン)有限公司
マレーシア:Agensi Pekerjaan PERSOLKELLY Malaysia Sdn. Bhd.
フィリピン:John Clements. Recruitemt,Inc.
タイ:PERSOLKELLY HR Services Recruitment (Thailand) Co., Ltd.

※1.本案件以外にご紹介できる求人がご用意できない場合には、求人発生時までカウンセリングをお待ちいただいております。予めご了承ください。
※2.本案件に記載されている内容は、雇用主との労働契約締結時の労働条件等と異なる可能性がございます。

求人詳細

気になるリストに保存しました

「気になるリストへ」のボタンから、気になるリスト一覧へ移動できます

求人コード 3014455168

株式会社Unsung Fields

【横浜】推論システムエンジニア(LLM サービングランタイム + パフォーマンス)

New
正社員
転勤なし

気になるリストに保存しました

「気になるリストへ」のボタンから、気になるリスト一覧へ移動できます

この求人に応募しますか?

この求人を何度も見ている方へのお知らせです

気になるリストに保存しました

「気になるリストへ」のボタンから、気になるリスト一覧へ移動できます