44

请求中的接受语言标头通常是一个很长的复杂字符串 -

例如。

Accept-Language : en-ca,en;q=0.8,en-us;q=0.6,de-de;q=0.4,de;q=0.2

有没有一种简单的方法可以在java中解析它?或者一个 API 来帮助我做到这一点?

4

7 回答 7

49

我建议使用ServletRequest.getLocales()让容器解析 Accept-Language 而不是尝试自己管理复杂性。

于 2011-07-27T15:17:41.693 回答
40

作为记录,现在可以使用Java 8

Locale.LanguageRange.parse()
于 2015-03-12T01:07:51.847 回答
16

这是解析不需要 servlet 容器的 Accept-Language 标头的另一种方法:

String header = "en-ca,en;q=0.8,en-us;q=0.6,de-de;q=0.4,de;q=0.2";
for (String str : header.split(",")){
    String[] arr = str.trim().replace("-", "_").split(";");

  //Parse the locale
    Locale locale = null;
    String[] l = arr[0].split("_");
    switch(l.length){
        case 2: locale = new Locale(l[0], l[1]); break;
        case 3: locale = new Locale(l[0], l[1], l[2]); break;
        default: locale = new Locale(l[0]); break;
    }

  //Parse the q-value
    Double q = 1.0D;
    for (String s : arr){
        s = s.trim();
        if (s.startsWith("q=")){
            q = Double.parseDouble(s.substring(2).trim());
            break;
        }
    }

  //Print the Locale and associated q-value
    System.out.println(q + " - " + arr[0] + "\t " + locale.getDisplayLanguage());
}

您可以在此处找到 Accept-Language 标头和相关 q 值的说明:

http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html

非常感谢 Karl Knechtel 和 Mike Samuel。他们对原始问题的评论帮助我指出了正确的方向。

于 2012-08-27T11:32:13.007 回答
4

我们正在使用 Spring boot 和 Java 8。这行得通

在 ApplicationConfig.java 中写这个

@Bean

public LocaleResolver localeResolver() {
    return new SmartLocaleResolver();
}

我的常量类中有这个列表,其中包含我们支持的语言

List<Locale> locales = Arrays.asList(new Locale("en"),
                                         new Locale("es"),
                                         new Locale("fr"),
                                         new Locale("es", "MX"),
                                         new Locale("zh"),
                                         new Locale("ja"));

并在下面的类中编写逻辑。

public class SmartLocaleResolver extends AcceptHeaderLocaleResolver {
          @Override
         public Locale resolveLocale(HttpServletRequest request) {
            if (StringUtils.isBlank(request.getHeader("Accept-Language"))) {
            return Locale.getDefault();
            }
            List<Locale.LanguageRange> ranges = Locale.LanguageRange.parse("da,es-MX;q=0.8");
            Locale locale = Locale.lookup(ranges, locales);
            return locale ;
        }
}
于 2016-04-21T19:17:10.713 回答
3

ServletRequest.getLocale()如果它可用并且没有像某些框架那样被覆盖,那肯定是最好的选择。

对于所有其他情况,Java 8 提供Locale.LanguageRange.parse()了之前由 Quiang Li 提到的。然而,这只会返回一个语言字符串,而不是一个语言环境。要解析可以使用的语言字符串Locale.forLanguageTag()(自 Java 7 起可用):

    final List<Locale> acceptedLocales = new ArrayList<>();
    final String userLocale = request.getHeader("Accept-Language");
    if (userLocale != null) {
        final List<LanguageRange> ranges = Locale.LanguageRange.parse(userLocale);

        if (ranges != null) {
            ranges.forEach(languageRange -> {
                final String localeString = languageRange.getRange();
                final Locale locale = Locale.forLanguageTag(localeString);
                acceptedLocales.add(locale);
            });
        }
    }
    return acceptedLocales;
于 2015-08-31T14:19:09.163 回答
1
Locale.forLanguageTag("en-ca,en;q=0.8,en-us;q=0.6,de-de;q=0.4,de;q=0.2")
于 2015-09-29T12:56:58.957 回答
1

上述解决方案缺乏某种验证。ServletRequest.getLocale()如果用户没有提供有效的区域设置,则使用返回服务器区域设置。

我们的网站最近收到了各种Accept-Language标题的垃圾邮件请求,例如:

  1. secret.google.com
  2. o-o-8-o-o.com search shell is much better than google!
  3. Google officially recommends o-o-8-o-o.com search shell!
  4. Vitaly rules google ☆*:。゜゚・*ヽ(^ᴗ^)ノ*・゜゚。:*☆ ¯\_(ツ)_/¯(ಠ益ಠ)(ಥ‿ಥ)(ʘ‿ʘ)ლ(ಠ_ಠლ)( ͡° ͜ʖ ͡°)ヽ(゚Д゚)ノʕ•̫͡•ʔᶘ ᵒᴥᵒᶅ(=^ ^=)oO

此实现可以根据受支持的有效列表进行可选检查Locale。如果没有这个检查,带有"test"or (2, 3, 4) 的简单请求仍然会绕过LanguageRange.parse(String).

它可选允许空值和空值以允许搜索引擎爬虫。

小服务程序过滤器

final String headerAcceptLanguage = request.getHeader("Accept-Language");

// check valid
if (!HttpHeaderUtils.isHeaderAcceptLanguageValid(headerAcceptLanguage, true, Locale.getAvailableLocales()))
    return;

效用

/**
 * Checks if the given accept-language request header can be parsed.<br>
 * <br>
 * Optional the parsed LanguageRange's can be checked against the provided
 * <code>locales</code> so that at least one locale must match.
 *
 * @see LanguageRange#parse(String)
 *
 * @param acceptLanguage
 * @param isBlankValid Set to <code>true</code> if blank values are also
 *            valid
 * @param locales Optional collection of valid Locale to validate any
 *            against.
 *
 * @return <code>true</code> if it can be parsed
 */
public static boolean isHeaderAcceptLanguageValid(final String acceptLanguage, final boolean isBlankValid,
    final Locale[] locales)
{
    // allow null or empty
    if (StringUtils.isBlank(acceptLanguage))
        return isBlankValid;

    try
    {
        // check syntax
        final List<LanguageRange> languageRanges = Locale.LanguageRange.parse(acceptLanguage);

        // wrong syntax
        if (languageRanges.isEmpty())
            return false;

        // no valid locale's to check against
        if (ArrayUtils.isEmpty(locales))
            return true;

        // check if any valid locale exists
        for (final LanguageRange languageRange : languageRanges)
        {
            final Locale locale = Locale.forLanguageTag(languageRange.getRange());

            // validate available locale
            if (ArrayUtils.contains(locales, locale))
                return true;
        }

        return false;
    }
    catch (final Exception e)
    {
        return false;
    }
}
于 2016-12-20T01:47:07.527 回答