代码之家  ›  专栏  ›  技术社区  ›  hroptatyr

日期字符串的快速自动猜测

  •  3
  • hroptatyr  · 技术社区  · 14 年前

    日期格式的测试集必须是可变的,但是从许多给定的日期格式编译一个最优决策树或其他东西是可以的。

    有没有人遇到过类似的问题,甚至产生过类似的代码?

    2 回复  |  直到 14 年前
        1
  •  1
  •   Roaker    14 年前

    我用一个Perl脚本处理了来自许多来源的50多种格式的时间戳传感器数据(结构上是CSV)。从不受功能限制,虽然它是基于脚本的,但速度相当快(>10行/秒,其中行为~60-100个字符) 我实现了 …为决策逻辑建立上下文。 b) 发出带有行号和上下文的错误行 c) 行间时差 …只允许增加时间戳。 d) 我还可以重新格式化其他的东西,比如把单位改成国际单位制。 尽管来自C阵营,简单的Perl并不陌生,但是它使它变得更加容易 注意:如果文件中有足够的信息,此方法可以处理10/04/05即DD/MM/YY或MM/DD/YY之类的问题

        2
  •  1
  •   hroptatyr    14 年前

    经过两个星期的过度浏览,我得出结论,我必须自己写这篇文章。FTW,我的第一次尝试: http://github.com/hroptatyr/glod