Konvertera Word-dokument till Markdown: En komplett guide
Använda pandoc, python eller onlineverktyg för konvertering till MD
Konvertera Word-dokument till Markdown-format är en mycket vanlig uppgift för tekniska skrivare, utvecklare och innehållsskapare som vill flytta sitt innehåll till plattformar med Markdown (t.ex. GitHub, GitLab, statiska webbplatsgeneratorer som Hugo). Den här guiden är en del av vår Dokumentationsverktyg i 2026: Markdown, LaTeX, PDF & Skrivningsflöden hub.
Den här guiden täcker flera metoder och verktyg för att utföra denna konvertering effektivt.

Varför konvertera Word till Markdown?
Markdown har flera fördelar jämfört med Word-dokument:
- Vänlig för versionskontroll: Enkelt textformat fungerar bra med Git
- Plattformsoberoende: Läsbar på alla system utan särskilt programvaru
- Framtida säkerhet: Enkelt textformat som inte blir föråldrad
- Webbklar: Enkel konvertering till HTML för webbplatser och bloggar
- Lättviktigt: Många mindre filstorlekar
- Automatiseringsvänligt: Enkelt att bearbeta programmatiskt
Vad Pandoc bevarar:
- Rubriker (konverteras till
#,##,###, osv.) - Fet och kursiv formatering
- Listor (punkterade och numrerade)
- Länkar och referenser
- Tabeller (konverteras till Markdown-tabeller eller HTML)
- Kodblock och inlin kod
- Bilder (med
--extract-media-alternativet) - Fotnoter
Metod 1: Använda Pandoc (Rekommenderat)
Pandoc är en universell dokumentkonverterare som märks ut för att konvertera mellan olika markup-formater. Det är det mest tillförlitliga verktyget för konvertering från Word till Markdown.
Installera Pandoc
På Ubuntu/Debian:
sudo apt update
sudo apt install pandoc
På macOS:
# Med Homebrew
brew install pandoc
# Eller ladda ner från den officiella webbplatsen
# https://pandoc.org/installing.html
På Windows:
# Med Chocolatey
choco install pandoc
# Eller ladda ner installationsprogrammet från:
# https://github.com/jgm/pandoc/releases
Verifiera installation:
pandoc --version
Konvertera med Pandoc
För DOCX-filer (modern Word-format):
pandoc document.docx -o document.md
För äldre DOC-filer:
Pandoc kan inte direkt läsa .doc-filer. Du måste först konvertera dem till .docx med LibreOffice:
# Först konvertera DOC till DOCX
libreoffice --headless --convert-to docx document.doc
# Sedan konvertera DOCX till Markdown
pandoc document.docx -o document.md
Avancerade Pandoc-alternativ:
# Konvertera med specifikt Markdown-variant
pandoc document.docx -t gfm -o document.md # GitHub Flavored Markdown
# Extrahera bilder till en mapp
pandoc document.docx --extract-media=./images -o document.md
# Bevara mer formatering
pandoc document.docx -t markdown+pipe_tables+raw_html -o document.md
# Konvertera med anpassningsbar mall
pandoc document.docx --template=custom.template -o document.md
Metod 2: Använda LibreOffice + Pandoc (För DOC-filer)
När du hanterar äldre .doc-filer fungerar detta tvåstegsprocess bäst:
Installera LibreOffice
På Ubuntu/Debian:
sudo apt update
sudo apt install libreoffice
På macOS:
brew install --cask libreoffice
På Windows: Ladda ner från LibreOffice webbplats
Konverteringsprocess:
# Steg 1: Konvertera DOC till DOCX
libreoffice --headless --convert-to docx document.doc
# Steg 2: Konvertera DOCX till Markdown med Pandoc
pandoc document.docx -o document.md
# Rensa upp mellanfil (valfritt)
rm document.docx
Batchkonverteringsskript med pandoc:
Skapa ett skript för att konvertera flera filer:
#!/bin/bash
# convert-docs.sh
for file in *.doc; do
if [ -f "$file" ]; then
echo "Konverterar $file..."
# Konvertera DOC till DOCX
libreoffice --headless --convert-to docx "$file"
# Hämta filnamn utan utökning
basename=$(basename "$file" .doc)
# Konvertera DOCX till Markdown
pandoc "${basename}.docx" -o "${basename}.md"
# Rensa upp mellanfilen DOCX
rm "${basename}.docx"
echo "✓ Skapade ${basename}.md"
fi
done
Gör den körbar och kör:
chmod +x convert-docs.sh
./convert-docs.sh
Metod 3: Onlinekonverterare (Snabb och enkel)
För ovanliga konverteringar kan onlineverktyg vara bekväma:
Populära onlinekonverterare:
- Pandoc Try: https://pandoc.org/try/
- Word till Markdown-konverterare: https://word2md.com/
- Dillinger: https://dillinger.io/ (har importfunktion)
Fördelar och nackdelar:
- Fördelar: Ingenting att installera, fungerar på alla enheter
- Nackdelar: Sekretessfrågor, filstorleksgränser, mindre kontroll över utdata
Metod 4: Använda Word:s inbyggda export (Begränsad)
Modernare versioner av Microsoft Word kan exportera till grundläggande Markdown:
- Öppna ditt dokument i Word
- Gå till Fil → Exportera → Ändra filtyp
- Välj Webbsida, filtrerad (*.html)
- Använd en HTML till Markdown-konverterare som Pandoc:
pandoc document.html -o document.md
Notera: Den här metoden ger ofta mindre goda resultat jämfört med direkt DOCX-konvertering.
Metod 5: Programmeringslösningar
Python med python-docx och markdownify:
#!/usr/bin/env python3
import sys
from docx import Document
from markdownify import markdownify
def docx_to_markdown(docx_path, md_path):
# Läs in DOCX-filen
doc = Document(docx_path)
# Extrahera text (grundläggande konvertering)
full_text = []
for paragraph in doc.paragraphs:
full_text.append(paragraph.text)
# Konvertera till markdown (grundläggande)
markdown_content = '\n\n'.join(full_text)
# Skriv till fil
with open(md_path, 'w', encoding='utf-8') as f:
f.write(markdown_content)
if __name__ == "__main__":
if len(sys.argv) != 3:
print("Användning: python docx_to_md.py input.docx output.md")
sys.exit(1)
docx_to_markdown(sys.argv[1], sys.argv[2])
print(f"Konverterade {sys.argv[1]} till {sys.argv[2]}")
Installera beroenden:
pip install python-docx markdownify
Notera: Detta är en grundläggande implementation. Pandoc kommer att ge bättre resultat för komplexa dokument.
Hantera vanliga problem
1. Komplexa tabeller
# Använd pipe-tabellformat för bättre kompatibilitet
pandoc document.docx -t markdown+pipe_tables -o document.md
2. Bilder som inte konverteras
# Extrahera bilder till en separat mapp
pandoc document.docx --extract-media=./images -o document.md
3. Formateringsförlust
# Bevara mer HTML för komplex formatering
pandoc document.docx -t markdown+raw_html -o document.md
4. Karaktärskodningsproblem
# Ange UTF-8-kodning
pandoc document.docx -t markdown -o document.md --from=docx --to=markdown
Bästa praxis
1. Förberedelse före konvertering
- Rensa upp ditt Word-dokument före konvertering
- Använd konsekventa rubrikstilar (Rubrik 1, Rubrik 2, osv.)
- Undvik komplex formatering som inte översätts väl till Markdown
- Använd Word:s inbyggda listformatering istället för manuella punkter
2. Efterkonverteringsrening
- Granska utdata för formateringsproblem
- Fixa tabellformatering om det behövs
- Justera bildsökvägar och alternativtext
- Rensa upp extra radbrytningar eller utrymme
3. Automatiseringsråd
# Skapa en alias för vanlig konvertering
echo 'alias doc2md="pandoc --from=docx --to=markdown"' >> ~/.bashrc
# Funktion för batchkonvertering
doc2md_batch() {
for file in *.docx; do
pandoc "$file" -o "${file%.docx}.md"
done
}
Jämförelse av metoder
| Metod | Fördelar | Nackdelar | Bäst för |
|---|---|---|---|
| Pandoc | Utmärkt kvalitet, många alternativ | Kräver installation | Regelbundna konverteringar, komplexa dokument |
| LibreOffice + Pandoc | Hanterar DOC-filer | Tvåstegsprocess | Äldre DOC-filer |
| Onlinekonverterare | Ingenting att installera | Sekretess, begränsade funktioner | Snabba enkelkonverteringar |
| Word-export | Inbyggd | Dålig kvalitet på utdata | Enkla dokument endast |
| Programmering | Anpassningsbar | Kräver kodning | Automatiserade flöden |
Kort sammanfattning
För de flesta användare är Pandoc den rekommenderade lösningen för att konvertera Word-dokument till Markdown. Det ger bästa balansen mellan kvalitet, funktioner och tillförlitlighet. För äldre .doc-filer fungerar kombinationen LibreOffice + Pandoc utmärkt.
Nyckeln till framgångsrik konvertering är:
- Förbered ditt Word-dokument med konsekvent formatering
- Välj rätt verktyg för dina specifika behov
- Granska och rengör utdata
- Automatisera processen om du gör regelbundna konverteringar
Med dessa verktyg och tekniker kan du effektivt konvertera dina Word-dokument till Markdown-format medan du bevarar mycket av den ursprungliga formateringen och strukturen.
Snabbreferenskommandon
# Grundläggande konvertering (DOCX till Markdown)
pandoc document.docx -o document.md
# DOC till Markdown (två steg)
libreoffice --headless --convert-to docx document.doc
pandoc document.docx -o document.md
# GitHub Flavored Markdown
pandoc document.docx -t gfm -o document.md
# Extrahera bilder
pandoc document.docx --extract-media=./images -o document.md
# Batchkonvertera alla DOCX-filer
for file in *.docx; do pandoc "$file" -o "${file%.docx}.md"; done