我有一个简单的Python(2.7)脚本,它读取数据库表并输出行。最初不需要使用unicode,脚本就是这样:
users = config.Session.query(User).order_by(User.id).all()
for _f in users:
print "{0:6d} {1:20} {2:30} {3:}".format(_f.id, _f.foo, _f.name, _f.url)
739 42352 Foo Bar https://...
740 23555 Another User https://...
741 774577 Third User https://...
然后我们开始在数据库中输入重音名称。最初,脚本开始提出一个关于ascii编解码器不满意的异常。
我试图修复脚本,我做到了。我去掉了这个例外,但现在名称中的每个重音字符似乎都是双倍的,导致URL字段关闭了N个字符,N是名称中重音字符的数量。
for _f in users:
uname = _f.name.encode('utf-8')
print "{0:6d} {1:20} {2:30} {3:}".format(_f.id, _f.foo, uname, _f.url)
现在的输出是:
739 42352 Foo Bar https://...
740 23555 Ãnöther User https://...
741 774577 Third User https://...
我需要在格式化字符串中添加什么才能正确计算带有重音字符的unicode字符串的长度?