Select Page



Multiverse Computing




Envía tu CV Zure CVa bidali



Volver a oportunidades Aukeretara bueltatu

Senior LLM Engineer

Senior LLM ingeniaria


Fecha de publicación: 30 July 2025

Data argitaratua: asteazkena, 30 uztaila 2025

Ingeniero/as y técnicos (Industrial, Mecánico y Electricidad)
Industria, Mekanikoa eta Elektrizitatea

¿Qué buscamos?
As a Senior LLM Engineer, you will
- Design and implement strategies for creating, sourcing, and augmenting datasets tailored for LLM training and fine-tuning.
- Develop scalable pipelines to collect, clean, filter, annotate, and validate large volumes of text data, ensuring quality, ethical compliance, etc.
- Collaborate with ML engineers, researchers, and software engineers to achieve ambitious goals in the preparation of LLMs and complementary work (preparing datasets, model evaluation, model serving, etc.).
- Develop and integrate new routines for modifying and enhancing LLMs, and extending their functionality.
- Make effective use of distributed compute resources and clusters (GPU’s), identify opportunities for further optimization.
- End-to-end preparation of compressed and specialized LLMs for use in production.
- Keep up to date with research trends in LLM foundation models, dataset curation, LLM pretraining data, and benchmarking.
- Contribute to building documentation, development standards, and a healthy shared code base.
- Mentor other engineers and provide knowledge sharing of cutting-edge techniques.
Zer bilatzen dugu?
LLMko ingeniari seniorra zarenez,
- LLM entrenatzeko eta prest jartzeko neurrira egindako datasetak sortu, kontratatu eta handitzeko estrategiak diseinatu eta ezartzea.
- Oliobide eskalagarriak garatzea, testu-datuen bolumen handiak bildu, garbitu, iragazi, idatzi eta baliozkotzeko, kalitatea, betetze etikoa eta abar bermatuz.
- MLko ingeniariekin, ikertzaileekin eta software-ingeniariekin lankidetzan aritzea, asmo handiko helburuak lortzeko LMak eta lan osagarriak prestatzean (datasetak prestatzea, ereduak ebaluatzea, ereduak zerbitzatzea, etab.).
- Errutina berriak garatu eta integratzea, LMak aldatu eta hobetzeko, eta horien funtzionaltasuna zabaltzeko.
- Banatutako baliabide konputagarriak eta klusterrak (GPU 's) eraginkortasunez erabiltzea, eta gero optimizatzeko aukerak identifikatzea.
- LM konprimituak eta espezializatuak azken muturreraino prestatzea, ekoizpenean erabiltzeko.
- LLM fundazio-modeloen, dataset bidezko sendaketaren, LLMren datu eskergen eta benchmarkingaren ikerketa-joerak eguneratuta eduki.
- Dokumentazioa, garapen-arauak eta kode partekatuen oinarri osasungarria eraikitzen laguntzea.
- Beste ingeniari batzuk orientatu eta puntako tekniken ezagutza partekatu.


¿Qué te ofrecemos?
- Indefinite contract.
- Equal pay guaranteed.
- Variable performance bonus.
- Signing bonus.
- We offer work visa sponsorship (If applicable).
- Relocation package (if applicable).
- Private health insurance.
- Eligibility for educational budget according to internal policy.
- Hybrid opportunity.
- Flexible working hours.
- Language classes and discounted lunch options
- Working in a high paced environment, working on cutting edge technologies.
- Career plan. Opportunity to learn and teach.
- Progressive Company. Happy people culture

Zer eskaintzen dizugu?
- Kontratu mugagabea.
- Soldata berdina bermatuta.
- Errendimendu aldakorreko hobaria.
- Sinatze Bonoa.
- Laneko bisen babesa eskaintzen dugu (hala badagokio).
- Birkokatze-paketea (hala badagokio).
- Aseguru mediko pribatua.
- Hezkuntza-aurrekontua barne-politikaren arabera bete ahal izatea.
- Aukera hibridoa.
- Ordutegi malgua.
- Hizkuntza klaseak eta bazkaltzeko aukera deskontatuak.
- Ingurune lasai batean lan egiten, mugako teknologietan.
- Karrera plana. Ikasteko eta irakasteko aukera.
- Konpainia aurrerakoia. Jende zoriontsuaren kultura


Formación academica
Master’s, or Ph.D. in Computer Science, AI, Data Science, Physics, Math, or a related field. Or equivalent industry experience.

Prestakuntza akademikoa
- Masterra edo Doktoregoa Informatika, IA, Datuen Zientzia, Fisika, Matematika edo antzeko arlo batean. Edo industria-esperientzia baliokidea.


Formación específica
Preferred Qualifications - Experience building or contributing to datasets used in LLM pretraining or supervised fine-tuning. - Experience building foundational LLMs from the ground up - Familiarity with alignment techniques (e.g., reinforcement learning, preference modeling, reward modeling). - Exposure to multilingual and low-resource language datasets. - Contributions to open-source datasets, tools, or publications in dataset-centric research. - Knowledge of ethical AI, data governance, privacy laws (e.g., GDPR), and responsible data use. - Familiarity with the software development lifecycle and agile methodologies

Prestakuntza espezifikoa
Lehentasunezko titulazioak

- Esperientzia LLMn erabiltzen diren datu-baseak eraikitzen edo horietan ekarpenak egiten.
- Esperientzia LLMak eraikitzen behetik gora.
- Lerrokatze-teknikekin ohitzea (adibidez, sendotze-ikaskuntza, hobetze-modelatzea, sari-modelatzea).
- Hizkuntza eleaniztunetako eta baliabide gutxiko datu-baseekiko esposizioa.
- Dataset, tresna edo datu-zentroetako argitalpenei egindako ekarpenak.
- AI etikoaren ezagutza, datuen gobernantza, pribatutasun-legeak (adibidez, DBEO), eta datuen erabilera arduratsua.
- Softwarearen garapenaren bizi-zikloa eta metodologia bizkorrak ezagutzea.


Nivel de idiomas requerido: -

Hizkuntzak eta eskatutako maila: -


Experiencia en funciones similares: Más de 3 años

Antzeko eginkizunetan eskatutako esperientzia: 3 urte baino gehiago


Competencias:
- 3+ years of experience in data science, machine learning, or related roles, with demonstrated experience with NLP or LLMs. - In-depth knowledge of large foundational model architectures (language and multimodal models) and their lifecycle: training, fine-tuning, alignment, and evaluation. - Proficient in Python and data tooling ecosystems (Pandas, NumPy, Hugging Face Datasets & Transformers libraries). - Hands-on experience with text data collection from diverse sources: web scraping, APIs, proprietary corpora, etc. - Strong understanding of data quality metrics including bias detection, toxicity, and readability. - Experience working in large shared distributed computing environments, familiarity with relevant tools for hardware optimization (vLLM, TensorRT, NeMo, etc.). - Experience with version control (git), unit testing, and other fundamental aspects of software development. - Effective communication and interpersonal abilities.

Gaitasunak:
- 3+ urteko esperientzia datuen zientzian, ikasketa automatikoan edo antzeko roletan, NLP edo LLMekin frogatutako esperientziarekin.
- Sorrerako eredu-arkitektura handiak (hizkuntza-ereduak eta eredu multimodalak) eta horien bizi-zikloa sakon ezagutzea: prestakuntza, doikuntza, lerrokatzea eta ebaluazioa.
- Python eta datu-tresnen ekosistemetan trebea (Pandas, NumPy, Hugging Face Datasets & Transformers liburutegiak).
- Hainbat iturritako testuen datu-bilketaren esperientzia: web karrakatzea, APIak, jabetzako korporazioa, eta abar.
- Datuen kalitatearen metrikak ondo ulertzea, alborapena, toxikotasuna eta irakurgarritasuna barne.
- Partekatutako konputazio-ingurune zabaletan lan egiten duen esperientzia, hardwarea optimizatzeko tresna garrantzitsuak ezagutzen dituena (vLLM, TensorRT, NeMo, etab.).
- Esperientzia bertsioen kontrolarekin (git), unitate-probekin eta softwarearen garapenaren funtsezko beste alderdi batzuekin.
- Komunikazio eraginkorra eta pertsonen arteko gaitasunak.