5

在 codewars 上工作我试图解决这个问题:

在这个 kata 中,我们要将字符串转换为整数。字符串仅表示单词中的数字。

例子:

  • “一个” => 1
  • “二十” => 20
  • “246” => 246
  • “七十八万三千九百一十九” => 783919

==================================================== =================================

我想出了下面的代码来做到这一点。 在 jsfiddle 上为您提供便利。

我遇到的一个问题是'七十万'给你10700。

我花了一天的时间环顾四周并试图弄清楚这一点,但我只是卡住了。该程序采取的步骤是:

  • 字符串变为“千百七” - 好
  • 第一个 while 循环找到“千”并将乘数设置为 1000 - 好
  • 第二个 while 循环找到 'hundred',但随后 mult.exec(a[0]) if 语句解析为 null。- 该死

所以乘数不是变成 100000,而是值变成 100000,我们注定会得到错误的答案。

在尝试调试时,我尝试在 jsfiddle 的 while 中的第二个循环中创建一个正在使用的数组。在那里它起作用并等同于“一百”而不是空值。有谁知道为什么会发生这种情况?

function parseInt(number) { 

    // reference array for english -> integer
    var ref = { one:1, two:2, three:3, four:4, five:5, six:6, seven:7, eight:8, nine:9, ten:10, eleven:11, twelve:12, thirteen:13, fourteen:14, fifteen:15, sixteen:16, seventeen:17, eighteen:18, nineteen:19, twenty:20, thirty: 30, forty: 40, fifty: 50, sixty: 60, seventy: 70, eighty: 80, ninety:90, hundred: 100, thousand: 1000, million: 1000000 };

    // regex to find number values from the string
    var find = new RegExp( "(one|t(wo|hree|en|welve|hirteen|wenty|hirty)|f(our|ive|ourteen|iftenn|orty|ifty)|s(ixteen|ixty|eventy|ix|even|eventeen|teen)|eigh(ty|t|teen)|nin(ety|e|eteen)|zero|hundred|thousand|million)", "gi" );

    // hundred/thousand/million etc. act as multipliers in this solution and need a seperate search
    var mult = new RegExp( "(hundred|thousand|million)", "gi" );

    // reversing the string allows us to add largest digits first
    number = number.split(' ').reverse().join(" ");

    // while there is a number in string number
    //   if that number is a multiplier
    //     if that number is 100 -> multiplier = multiplier * 100;
    //     else multiplier = reference value;
    //   else value = value + reference value * multiplier
    // end while
    value = 0; multiplier = 1;
    while( a = find.exec(number) ) {

        if( m = mult.exec(a[0]) ) {

            if( m[0] == 'hundred' ) { multiplier *= 100; }
            else { multiplier = ref[m[0]]; }

        }
        else {

            value += ref[a[0]] * multiplier;

        }

    }   
    return value;
}
4

4 回答 4

5

也许你不需要正则表达式

function parse(numbersInString){
    var ref = { one:1, two:2, three:3, four:4, five:5, six:6, seven:7, eight:8, nine:9, ten:10, eleven:11, twelve:12, thirteen:13, fourteen:14, fifteen:15, sixteen:16, seventeen:17, eighteen:18, nineteen:19, twenty:20, thirty: 30, forty: 40, fifty: 50, sixty: 60, seventy: 70, eighty: 80, ninety:90 },
        mult = { hundred: 100, thousand: 1000, million: 1000000 },
        strNums = numbersInString.split(' ').reverse(),
        number = 0,
        multiplier = 1;

    for(i in strNums){
        if( mult[strNums[i]] != undefined ) {
            if(mult[strNums[i]]==100) {
                multiplier*=mult[strNums[i]]
            }else{
                multiplier=mult[strNums[i]]
            }
        } else {
            if (!isNaN(parseFloat(strNums[i]))) {
                number += parseFloat(strNums[i]) * multiplier;
            } else {
                var nums = strNums[i].split('-');
                number += ((ref[nums[0]]||0) + (ref[nums[1]]||0)) * multiplier;
            }
        }
    }
    return number;
}
于 2013-11-09T21:59:35.017 回答
1

感觉mult.exec应该将while所有乘数放在一起。

这个小片段

while( a = find.exec(number) ) {
    if( m = mult.exec(a[0]) ) {
        while(m) {
            multiplier *= ref[m[0]];
            m = mult.exec(a[0]);
        }
    }
    else {
        value += ref[a[0]] * multiplier;
    }
}   

让七十万的人做事,但随后却因为这个庞大的数字而破产。number百在数组中的事实multiplier可能是问题的根源,尽管我找不到确切的解决方案。

有趣的小问题。也许有了这个线索,你就可以弄清楚其余的了。

于 2013-11-09T20:59:03.030 回答
1

非常有趣的问题。我认为观察字符串中无论何时出现一亿、十亿、十亿等非常重要,它可能是它乘以该数字之前的所有内容,也可能是数字本身。如果是一百,可能这还没有结束。稍后我们可能不得不乘以另一个众数,例如“十万”。

因此,我将总数的计算分为 3 个变量:totalOfUnitstotalOfHundredstotalOfMultitudes。然后按如下顺序修改所有数字:

  • 如果遇到低于 100 的数字,请将其添加到totalOfUnits
  • 如果遇到 100:
    • 如果totalOfUnits == 0,则加 100totalOfHundreds
    • 如果totalOfUnits> 0,则添加 100 * 个单位totalOfHundreds并设置totalOfUnits为 0
  • 如果遇到另一群人:
    • 如果totalOfUnits== 0 和数百 == 0,则将 multitude 本身添加到 totalOfMultitudes
    • 如果totalOfUnits> 0 或totalOfHundreds> 0,则将多个时间 ( totalOfUnits+ totalOfHundreds) 添加到 totalOfMultitudes 并将 and 设置totalOfUnitstotalOfHundreds0。

最后,返回totalOfUnits++ totalOfHundredstotalOfMultitudes代码适用于所有给定的示例,如下所示:

function parseNumber(num){
    var units = {
        zero:0, one:1, two:2, three:3, four:4, five:5, six:6, seven:7, eight:8, nine:9, ten:10,
        eleven:11, twelve:12, thirteen:13, fourteen:14, fifteen:15, sixteen:16, seventeen:17, eighteen:18, nineteen:19,
        twenty:20, thirty: 30, forty: 40, fifty: 50, sixty: 60, seventy: 70, eighty: 80, ninety:90
    };
    var hundreds = {
        hundred: 100
    };
    var multitudes = {
        hundred: 100,
        thousand: 1000,
        million: 1000000
    };

    var parts = num.split(/[ -]/);

    totalOfUnits = 0;
    totalOfHundreds = 0;
    totalOfMultitudes = 0;

    var result = undefined;

    for(var i = 0; i < parts.length; i++){
        if(units[parts[i]]){
            //Add unit
            totalOfUnits = totalOfUnits + units[parts[i]];
        }else if(hundreds[parts[i]]){
            totalOfHundreds += hundreds[parts[i]] * (totalOfUnits || 1);
            totalOfUnits = 0;
        }else if(multitudes[parts[i]]){
            totalOfMultitudes += multitudes[parts[i]] * (((totalOfUnits || 0) + (totalOfHundreds || 0)) || 1);
            totalOfUnits = totalOfHundreds = 0;
        }
    }

    return totalOfUnits + totalOfHundreds + totalOfMultitudes;
}
于 2013-11-09T23:19:31.523 回答
-1

这不是一个答案,但我想稍微评论一下这种方法,因为我看不出你怎么可能用你当前的算法解析单词。你可能让它适用于一个特定的实例或范围,但它永远不会适用于所有单词的变体。

如果您在数据结构中分别计算所有类型的单元,例如

var data = {
    millions:3, 
    hundredThousands:2,
    tenThousands:6, 
    thousands:6, 
    hundreds:0, 
    tens:8, 
    ones:9
};

计数后,您可以简单地将所有结果(包括零)串起来以组成整数值。

var value = [
        data.millions,
        data.hundredThousands,
        data.tenThousands,
        data.thousands,
        data.hundreds,
        data.tens,
        data.ones
    ].join('');

return parseInt(value); // 3266089
于 2013-11-09T21:46:04.967 回答