代码之家  ›  专栏  ›  技术社区  ›  David Macek

为什么即使没有涉及国家字符,排序也会影响相似匹配?

  •  0
  • David Macek  · 技术社区  · 7 年前

    问题:用户输入 %% 搜索连续包含2%符号的文本。应用程序将其转换为条件 ... LIKE '%\\%\\%%'

    我设法把问题缩小到整理。在几个MySQL和MariaDB版本中进行测试,下面的两个查询的计算结果不同。我试图仔细阅读LIKE运算符和排序规则,但找不到任何可以解释差异的东西。

    SELECT '%' COLLATE utf8_czech_ci LIKE '%\\%\\%%';
    

    结果: TRUE

    SELECT '%' COLLATE utf8_general_ci LIKE '%\\%\\%%';
    

    结果: FALSE

    2 回复  |  直到 7 年前
        1
  •  0
  •   Bud Damyanov    7 年前

    两个排序规则都包含不同的字符集(utf8\u捷克语ci/utf8\u通用语ci):

    A=a=ª=À=Á=Á=Â=Ã=Ä=Å=à=á=á=â=ã=ä=å=Ā=ā=Ą=ą  Aa  ae  az  Æ=æ  B=b  C=c=Ç=ç  cz  Č=č
    D=d=Ď=ď  dz  Ð=ð  E=e=È=É=É=Ê=Ë=è=é=é=ê=ë=Ē=ē=Ĕ=ĕ=Ė=ė=Ę=ę=Ě=ě  F=f  fz  ƒ
    G=g=ğ=Ģ=ģ  H=h  hz  ch  I=i=Ì=Í=Í=Î=Ï=ì=í=í=î=ï=Ī=ī=Į=į=İ  ij=ij  iz  ı  J=j  K=k=Ķ=ķ
    L=l=Ļ=ļ  lj=LJ=Lj=lj  ll  lz  Ł=ł  M=m  N=n=Ñ=ñ=Ń=ń=Ņ=ņ=Ň=ň  nz
    O=o=º=Ò=Ó=Ó=Ô=Õ=Ö=ò=ó=ó=ô=õ=ö  oe=Œ=œ  oz  Ø=ø  P=p  Q=q  R=r  Ř=ř  S=s=ş  sh  ss=ß  sz
    Š=Š=š=š  T=t=Ť=ť  TM=tm=™  tz  U=u=Ù=Ú=Ú=Û=Ü=ù=ú=ú=û=ü=Ū=ū=Ů=ů=Ų=ų  ue  uz  V=v  W=w
    X=x  Y=y=Ý=Ý=ý=ý=ÿ=Ÿ  yz  Z=z  zh  zz  Ž=Ž=ž=ž  Þ=þ  µ
    

    A=a=À=Á=Á=Â=Ã=Ä=Å=à=á=á=â=ã=ä=å=Ā=ā=Ą=ą  Aa  ae  az  B=b  C=c=Ç=ç=Č=č  ch  cz
    D=d=Ď=ď  dz  E=e=È=É=É=Ê=Ë=è=é=é=ê=ë=Ē=ē=Ĕ=ĕ=Ė=ė=Ę=ę=Ě=ě  F=f  fz  G=g=ğ=Ģ=ģ  H=h
    hz  I=i=Ì=Í=Í=Î=Ï=ì=í=í=î=ï=Ī=ī=Į=į=İ=ı  ij  iz  J=j  K=k=Ķ=ķ  L=l=Ļ=ļ  lj  ll  lz  M=m
    N=n=Ñ=ñ=Ń=ń=Ņ=ņ=Ň=ň  nz  O=o=Ò=Ó=Ó=Ô=Õ=Ö=ò=ó=ó=ô=õ=ö  oe  oz  P=p  Q=q  R=r=Ř=ř
    S=s=ß=ş=Š=Š=š=š  sh  ss  sz  T=t=Ť=ť  TM=tm  tz  U=u=Ù=Ú=Ú=Û=Ü=ù=ú=ú=û=ü=Ū=ū=Ů=ů=Ų=ų
    ue  uz  V=v  W=w  X=x  Y=y=Ý=Ý=ý=ý=ÿ=Ÿ  yz  Z=z=Ž=Ž=ž=ž  zh  zz
    Æ=æ  Ð=ð  ×  Ø=ø  Þ=þ  ÷  ij  Ł=ł  Œ=œ  ƒ  LJ=Lj=lj
    
        2
  •  0
  •   David Macek    7 年前

    似乎这只是一个老错误。我找到了至少两份确认的报告( https://bugs.mysql.com/bug.php?id=81990 https://bugs.mysql.com/bug.php?id=63829 )类似问题。