Kairos
Back to jobs

Support Engineer - AI Server Systems

On-site
TenstorrentTokyo, JP10 months agoWebsite
Customer Success

Compensation

Salary undisclosed
Apply
Share

Description

勤務地:東京

Tenstorrentでは、AIサーバーおよび関連インフラの安定運用を支える Support Engineer. AI Infrastrcuture を募集しています。
本ポジションでは、GPUクラスタ、ストレージ、ネットワーク機器を含むシステムの保守・障害対応・予防保守を担当し、社内外の関係者と連携しながら、高可用性なAIインフラ環境の維持に貢献していただきます。

Who You Are

  • ハードウェア保守・障害対応に強みを持ち、現場での迅速な切り分けと対応ができる方

  • 顧客現場やデータセンター環境でのサポート業務を主体的に進められる方

  • Linuxサーバー、GPUサーバー、ネットワーク機器に関する基本的な知識と実務経験をお持ちの方

  • インシデント発生時にも冷静に状況を整理し、適切にエスカレーションできる方

  • 国内外の関係者と協力しながら、正確で丁寧なコミュニケーションができる方

  • 実務を通してAIインフラや高性能コンピューティング環境への理解を深めたい方

What We Need

  • AIサーバーおよび関連システム(GPUクラスタ、ストレージ、ネットワーク機器等)の保守・点検・障害対応

  • サーバー障害時の一次切り分け、オンサイト修理、部品交換

  • NOC(Network Operations Center)やリモート監視ツールを用いた稼働状況の監視およびログ分析

  • トラブル発生時のインシデントレポート作成と関係者への報告

  • ファームウェア、BIOS、ドライバの更新対応

  • 顧客向け定期点検および予防保守の計画・実施

  • エンジニアリング部門およびサポート部門と連携したエスカレーション対応

  • 保守用在庫の管理、交換部品の配送調整

  • 現場導入支援、設置・移設作業への立ち会いおよび主導

  • 日本語および英語能力

Required Qualifications

  • x86サーバー、もしくはにGPUサーバーの保守経験

  • ハードウェア障害の切り分けスキル(電源、メモリ、ストレージ、PCIe、GPU等)

  • Linux環境(Ubuntu、RHEL、CentOS等)での操作経験

  • 基本的なネットワーク知識(L2/L3、TCP/IP、DHCP、IPMI)

  • 顧客現場での技術サポート経験、またはオンサイト対応経験

  • 障害対応や保守作業に関するドキュメント作成経験

  • IPMItool、smartctl、nvidia-smi等の診断ツール使用経験

  • 英語マニュアルの読解力、および海外サポート窓口とのやり取り経験

  • 英会話能力(エンジニア間でのQ&Aが可能なレベル
  •  

Nice to Have

  • NVIDIA GPUサーバー(DGX、HGX等)やSupermicro、Inspur、Lambda等のハードウェア取り扱い経験

  • Ethernet、InfiniBand、NVLink、PCIeスイッチに関する知識

  • データセンターでの運用・保守経験

  • GPUベースのディープラーニングやAIワークロードに関する基礎知識

  • Linux shellスクリプトによる簡易自動化経験

  • 普通自動車運転免許
  • 英語での交渉能力および詳細なテクニカルコミュニケ~ションが可能

What You Will Learn

  • 最先端のAIサーバーおよび高性能コンピューティング環境の運用知識

  • GPUクラスタ、ストレージ、ネットワークを含む大規模インフラの保守・トラブルシューティング実務

  • 社内エンジニアリングチームおよびグローバルサポートチームと連携した問題解決プロセス

  • AIワークロードを支えるハードウェア・システム全体の構造と運用の考え方

  • 急成長するAI・半導体業界における実践的なインフラサポートスキル

本雇用契約の提示は、応募者が米国の輸出管理対象技術へアクセス可能な資格を有することを条件とする場合があります。米国輸出関連法規に基づき、特定の情報、システム、または技術へのアクセスには、市民権、永住権の状況、または必要なライセンス取得可否の確認が必要となる場合があります。

Posted
Aug 28, 2025
Last seen
Jun 25, 2026
First seen
Jun 25, 2026
Status
active
Support Engineer - AI Server Systems at Tenstorrent | Kairos