Masteruppsats: Vektorisering av tabeller till RAG

5 days ago


Gothenburg, Västra Götaland, Sweden AI Sweden Full time 350,000 - 550,000 per year

Artificiell intelligens håller på att omvandla samhället. AI Sweden är det nationella centret för tillämpad artificiell intelligens, gemensamt finansierat av den svenska regeringen och våra partners, både offentliga och privata. Vårt uppdrag är att accelerera anväandningen av AI till nytta för vårt samhälle, vår konkurrenskraft och för alla som bor i Sverige.

Vi söker nu
masteruppsatsstudent(er)
för att ytterligare stärka vårt SVEA-team.

1 Introduktion
En stor del av många organisationers data, såsom budgetar, statistiska rapporter, regelverk och tekniska specifikationer, är ofta kommunicerade genom tabeller i icke-strukturerade PDF-, Word- eller Markdown-dokument. Att manuellt och genom regelbaserad metoder tolka dessa är ineffektivt och fel benäget. Det har utvecklats lösningar för detta med hjälp av språkmodeller, men dessa lösningar har

också hittats vara felbenägna. Detta projekt syftar till att utforska hur vi effektivt kan extrahera relevant information från tabeller.

Ert projektet kommer utveckla en robust pipeline för att automatiskt extrahera tabellbaserad data från dokument och omvandla den till meningsfulla vektorrepresentationer. Denna vektoriserade tabellinformation ska sedan integreras i ett RAG-verktyg för att förbättra förmågan att ställa komplexa frågor som kräver både textuell och strukturell data "Vilken budgetpost påverkades av den nya lagen enligt 2023 års budgettabell?").

Ni kommer att bygga en lösning som fokuserar på att överbrygga klyftan mellan den visuella layouten av en tabell och dess semantiska innehåll, vilket är

avgörande för att leverera högkvalitativa svar genom RAG.

2 Forskningsfrågor och tekniska utmaningar
2.1 Parsning av tabeller

Hur kan vi utveckla eller anpassa state-of-the-art metoder baserade på OCR, multimodala neurala nätverk eller LLM:er) för att exakt parsa och strukturbestämma komplexa tabeller i svenska offentliga dokument?

2.2 Semantiska tabellvektorer

Hur kan vi anpassa och använda neurala nätverk f ̈or att representera en tabells struktur, rubriker och datainnehåll som en enda, meningsfull vektor? Hur konstruerar vi specialiserade vektorer som fångar den semantiska informationen samt relationer mellan de olika fälten?

2.3 Sökbara tabeller

Vilka strategier är mest effektiva för att segmentera den extraherade och vektoriserade tabellinformationen för att maximera relevansen vid inhämtning? Hur säkerställer vi att de inbäddade tabellfragmenten effektivt kan matchas mot fr ̊agor i chat format?

2.4 Kvalitetssäakring och datarengöring

Hur säkerställer vi att datan har korrekt extraherats från dokument? Vilka strategier kan vi använda för att identifiera, imputera eller hantera saknade eller inkonsekventa data i de extraherade tabellerna?

3 Målgrupp och bidrag
Detta projekt är för studenter på masternivå med starkt intresse f ̈or NLP, Data Science och gränssnittet mellan strukturerad och icke-strukturerad data. Exakt på vad fokuset kommer att ligga tas fram tillsammans med de aktuella studenterna och baseras på deras erfarenheter och expertis. Resultaten från uppsatsen kommer att bidra till att tillgängliggöra kritisk data inom den svenska offentliga sektorn och därmed förbättra beslutsunderlag och transparens. Detta projekt är inom SVEA. Läs gärna mer om projektet SVEA

4 Kontakt
Adam Ek,

Referenser

  • Heng Gong, Xiaocheng Feng, Bing Qin, and Ting Liu. Table-to-text generation with effective hierarchical encoder on three dimensions (row, column and time). CoRR, abs/ , 2019.
  • Dehai Min, Nan Hu, Rihui Jin, Nuo Lin, Jiaoyan Chen, Yongrui Chen, Yu Li, Guilin Qi, Yun Li, Nijun Li, et al. Exploring the impact of table-to-text methods on augmenting llm-based question answering with domain hybrid data. arXiv preprint arXiv: , 2024.
  • Cornelius Wolff and Madelon Hulsebos. How well do llms reason over tabular data, really? arXiv preprint arXiv: , 2025.
  • Chi Zhang and Qiyang Chen. Hd-rag: Retrieval-augmented generation for hybrid documents containing text and hierarchical tables. arXiv preprint arXiv: , 2025.

Why should you do your master together whit AI Sweden?

To us, artificial intelligence is not only about tech, it's a force for positive societal change. You'll be working alongside leading AI experts, scientists, journalists, linguists, policy professionals, entrepreneurs, change leaders, and many more. To work here, you don't need to know "everything" about AI, but you need to believe in its potential to help shape our society for the better.

As an organization, we're uniquely positioned at the sweet spot of governmental influence and startup agility. Small enough to stay adaptive and have fun but backed by and in close contact with both the government, academia and private and public sector.

Join us to make a real-world impact by contributing to initiatives that benefit society and tackle critical challenges. Be at the forefront of AI innovation, working with cutting-edge technologies and playing a key role in shaping the future of AI in Sweden.

And, within our mission, we can most certainly be a platform empowering you to realize your ideas. AI Sweden's ability to empower partners and individual team members to do exceedingly well in their profession is a key success factor for driving positive and significant impact.

In short, we like to believe we offer our team members a place to grow, an environment for personal development.

An equal and fair working environment

We strongly believe in diversity and inclusion and are acutely aware of the skewed gender balance in our industry. We actively strive to put together a diverse team in terms of age, gender and background.

At AI Sweden, we are committed to building diverse and inclusive teams. Some positions may be subject to export control regulations, which means that specific requirements may apply depending on the role. If relevant, we will inform you clearly during the recruitment process.
AI Sweden does not accept unsolicited support and kindly ask not to be contacted by any advertisement agents, recruitment agencies or manning companies.



  • Gothenburg, Västra Götaland, Sweden AI Sweden Full time 400,000 - 600,000 per year

    Artificiell intelligens håller på att omvandla samhället. AI Sweden är det nationella centret för tillämpad artificiell intelligens, gemensamt finansierat av den svenska regeringen och våra partners, både offentliga och privata. Vårt uppdrag är att accelerera anväandningen av AI till nytta för vårt samhälle, vår konkurrenskraft och för...


  • Gothenburg, Västra Götaland, Sweden AI Sweden Full time 250,000 - 350,000 per year

    Artificiell intelligens håller på att omvandla samhället. AI Sweden är det nationella centret för tillämpad artificiell intelligens, gemensamt finansierat av den svenska regeringen och våra partners, både offentliga och privata. Vårt uppdrag är att accelerera anväandningen av AI till nytta för vårt samhälle, vår konkurrenskraft och för alla...


  • Gothenburg, Västra Götaland, Sweden NCC Full time 400,000 - 600,000 per year

    Röststyrd robotinteraktion med BIM-modeller: Integrering av tal med Boston Dynamics SPOT för byggplatsintelligensBakgrundByggbranschen börjar nu ta till sig robotik och AI för att öka effektivitet, säkerhet och datainformerat beslutsfattande. Boston Dynamics SPOT-robot har visat potential för autonom navigering och datainsamling på byggarbetsplatser....


  • Gothenburg, Västra Götaland, Sweden IMAB - en del av Derome Full time 400,000 - 600,000 per year

    Vill du ha ett jobb där du får frihet under ansvar, skapa långsiktiga kundrelationer och vara med på en spännande tillväxtresa? Hos IMAB, ett företag med starka rötter och en trygg framtid, söker vi nu två fältsäljare som vill vara med och utveckla vår marknad i Göteborgsområdet. Är du en relationsskapande säljare som brinner för kunder och...


  • Gothenburg, Västra Götaland, Sweden Hays Full time 800,000 - 1,200,000 per year

    Startdatum: december 2025Slutdatum: 30 april 2026Anställningsform: KontraktPlats: Göteborg, Västra Götaland, SverigeArbetssätt: hybridBeskrivning:Vår klient söker en erfaren och skicklig svensktalande Microsoft Fabric Konsult som kan ta en ledande roll i utvecklingen av avancerade datalösningar. Rollen kombinerar tekniskt ledarskap med djup expertis...


  • Gothenburg, Västra Götaland, Sweden Consilium Safety Sweden Full time 80,000 - 120,000 per year

    Shape the Future of SafetyTech with AIAtConsilium Safety Group, we don't just build technology — we create solutions that protect people, assets, and the planet. As a global leader in fire and gas safety, we serve critical industries such as marine, energy, rail, and construction.With more than 100 years of expertise and 55 offices worldwide, we're...

  • Fältsäljare

    3 days ago


    Gothenburg, Västra Götaland, Sweden IMAB - en del av Derome Full time 350,000 - 550,000 per year

    Fältsäljare till IMABVi söker en driven fältsäljare för B2B-försäljning av verktyg, industrivaror, arbetskläder och byggmaterial. Du ansvarar för befintliga kunder och nykundsbearbetning, genomför kundbesök och driver hela säljprocessen med stöd av vårt innesäljteam. Du utgår från Tagene, Alingsås eller Stenungsund och får tjänstebil...

  • AWS Architect

    5 days ago


    Gothenburg, Västra Götaland, Sweden Capgemini Full time 270,000 - 400,000 per year

    Att välja Capgemini innebär att välja en arbetsplats där du ges möjlighet att forma din karriär på det sätt du själv önskar, där du ingår i en stödjande och inspirerande gemenskap med engagerade kollegor världen över, och där du får chansen att omdefiniera vad som är möjligt. Våra Cloud & Custom applications-team fokuserar på att...


  • Gothenburg, Västra Götaland, Sweden Friday Väst AB Full time 450,000 - 650,000 per year

    Har du tidigare erfarenhet av kalibrering av förbränningssystem och vill fortsätta din resa hos ett globalt bolag inom fordonsindustrin? Vi söker nu dig som vill ta dig an en ny spännande utmaning där ingen dag är den andra lik Välkommen in med din ansökan.Om tjänsten:Som motorkalibreringsingenjör blir du en nyckelperson i utvecklingen av...


  • Gothenburg, Västra Götaland, Sweden Vinnergi Full time 650,000 - 850,000 per year

    Vill du arbeta i tekniskt utmanande projekt som bidrar till framtidens elnät och energiomställning? Hos oss på Vinnergi Power söker vi en Projekteringsledare som vill ta stort ansvar och utvecklas i rollen som teknikstöd inom projektering på stamnätet. Här blir du en del av ett team som driver Sveriges viktigaste infrastrukturprojekt – där din...