Hej HOL :)
Har lavet et lille program der gerne skulle tælle bogstaverne i et dokument (tekst.txt). Problemet er at jeg kan se at de i længere tekster tæller vokalerne forkert. Jeg satte den til at analysere en tekst på ca. 500.000 tegn, og det ser ud som om der er den samme fejl % på alle vokalerne, den er meget lille. f.eks. tæller den e=97.030, men i virkeligheden er e=96987.
Koden ser således ud:
#-*- coding: utf-8 -*-
from string import ascii_lowercase
from collections import Counter
import string
chars = []
allowed = string.ascii_letters +"æ" "ø" "å"
with open('/Users/[...]/tekst.txt') as f:
letters = Counter(letter for line in f
for letter in line.lower()
if letter in allowed)
with open('/Users/[...]/tekst.txt') as f:
for c in f.read():
chars.append(c)
num_letters = 0
for c in chars:
if c in allowed:
num_letters += 1
print ""
print letters
print ""
print "Letter count: %d " %(num_letters)
print "Remember to subtract the letter count with xc3"
print ""
print "xa5 = å"
print "xa6 = æ"
print "xa8 = ø"
--
Macbook Pro late 2011
Spiller CS:GO og Lol
og elsker at rode med elektronik :P
--
Sidst redigeret 05-12-2016 20:20