java - 如何计算成功和失败的平均探测长度 - 线性探测（哈希表）

Question

我正在为我的数据结构课程做作业。我们被要求研究负载系数为 0.1、.2、.3、.. 和 .9 的线性探测。测试公式为：

使用线性探测的平均探针长度大致为

成功--> (1 + 1/(1-L)**2)/2
或
失败--> (1+1(1-L))/2。

我们需要使用上面我所做的公式找到理论值（只需在公式中插入负载因子），然后我们必须计算经验值（我不太确定该怎么做）。这是其余的要求

**对于每个负载因子，10,000 个随机生成的介于 1 和 50000（含）之间的正整数将插入到“正确”大小的表中，其中“正确”严格基于您正在测试的负载因子。允许重复。确保您的随机生成整数的公式是正确的。在 java.util 中有一个名为 Random 的类。用它！在正确（基于 L）大小的表加载 10,000 个整数后，对新生成的 1 到 50000 范围内的随机整数进行 100 次搜索。计算两个公式中每一个的平均探针长度并指出使用的分母例如，在每个计算中，对于 0.5 负载的每个测试都会有一个 > > 大小约为 20,000（调整为素数）的表格，类似地，对于 .5 负载的每个测试。

程序应运行显示测试的各种负载因子、每次搜索的平均探针（用于计算平均值的两个分母将相加为 100）以及使用上述公式的理论答案。.**

我如何计算经验成功率？

到目前为止，这是我的代码：

import java.util.Random;
/**
 *
 * @author Johnny
 */
class DataItem
{
    private int iData;
    public DataItem(int it)
    {iData = it;}
    public int getKey()
    {
        return iData;
    }
}

class HashTable
{
private DataItem[] hashArray;
private int arraySize;
public HashTable(int size)
{
    arraySize = size;
    hashArray = new DataItem[arraySize];
}
public void displayTable()
{
    int sp=0;
    System.out.print("Table: ");
    for(int j=0; j<arraySize; j++)
{
    if(sp>50){System.out.println("");sp=0;}

    if(hashArray[j] != null){
        System.out.print(hashArray[j].getKey() + " ");sp++;}
    else
    {System.out.print("** "); sp++;}
}
    System.out.println("");
}

public int hashFunc(int key)
{
    return key %arraySize;
}

public void insert(DataItem item)
{
    int key = item.getKey();
    int hashVal = hashFunc(key);

    while(hashArray[hashVal] != null &&
                    hashArray[hashVal].getKey() != -1)
    {
        ++hashVal;
        hashVal %= arraySize;
    }
    hashArray[hashVal]=item;
}
public int hashFunc1(int key)
{
    return key % arraySize;
}

public int hashFunc2(int key)
{
// non-zero, less than array size, different from hF1
// array size must be relatively prime to 5, 4, 3, and 2
    return 5 - key % 5;
}


public DataItem find(int key) // find item with key
// (assumes table not full)
    {
    int hashVal = hashFunc1(key); // hash the key
    int stepSize = hashFunc2(key); // get step size
    while(hashArray[hashVal] != null) // until empty cell,
    { // is correct hashVal?
        if(hashArray[hashVal].getKey() == key)
            return hashArray[hashVal]; // yes, return item
        hashVal += stepSize; // add the step
        hashVal %= arraySize; // for wraparound
    }
    return null; // can’t find item
    }
}
public class n00645805 {
/**
 * @param args the command line arguments
 */
public static void main(String[] args) {
    double b=1;
    double L;
    double[] tf = new double[9];
    double[] ts = new double[9];
    double d=0.1;
    DataItem aDataItem;
    int aKey;
    HashTable h1Table = new HashTable(100003); //L=.1
    HashTable h2Table = new HashTable(50051);  //L=.2
    HashTable h3Table = new HashTable(33343);  //L=.3
    HashTable h4Table = new HashTable(25013);  //L=.4
    HashTable h5Table = new HashTable(20011);  //L=.5
    HashTable h6Table = new HashTable(16673);  //L=.6
    HashTable h7Table = new HashTable(14243);  //L=.7
    HashTable h8Table = new HashTable(12503);  //L=.8
    HashTable h9Table = new HashTable(11113);  //L=.9

    fillht(h1Table);
    fillht(h2Table);
    fillht(h3Table);
    fillht(h4Table);
    fillht(h5Table);
    fillht(h6Table);
    fillht(h7Table);
    fillht(h8Table);
    fillht(h9Table);
    pm(h1Table);
    pm(h2Table);
    pm(h3Table);
    pm(h4Table);
    pm(h5Table);
    pm(h6Table);
    pm(h7Table);
    pm(h8Table);
    pm(h9Table);

    for (int j=1;j<10;j++)
    {
        //System.out.println(j);
        L=Math.round((b-d)*100.0)/100.0;
        System.out.println(L);
        System.out.println("ts "+(1+(1/(1-L)))/2);
        System.out.println("tf "+(1+(1/((1-L)*(1-L))))/2);
        tf[j-1]=(1+(1/(1-L)))/2;
        ts[j-1]=(1+(1/((1-L)*(1-L))))/2;
        d=d+.1;
    }
    display(ts,tf);
}
public static void fillht(HashTable a)
{
    Random r = new Random();
    for(int j=0; j<10000; j++)
    {
        int aKey;
        DataItem y;
        aKey =1+Math.round(r.nextInt(50000));
        y = new DataItem(aKey);
        a.insert(y);

    }
}
public static void pm(HashTable a)
{
    DataItem X;
    int numsuc=0;
    int numfail=0;
    int aKey;
    Random r = new Random();
    for(int j=0; j<100;j++)
    {
        aKey =1+Math.round(r.nextInt(50000));
        X = a.find(aKey);
        if(X != null)
        {
            //System.out.println("Found " + aKey);
            numsuc++;
        }
        else
        {
            //System.out.println("Could not find " + aKey);
            numfail++;
        }

    }
    System.out.println("# of succ is "+ numsuc+" # of failures is "+ numfail);
}
public static void display(double[] s, double[] f)
{

}

}

score 3 · Accepted Answer

您应该考虑到 JavaHashTable使用封闭寻址（无探测）实现，因此您有单独的存储桶，其中可以放置许多项目。这不是您在基准测试中寻找的内容。我不确定HashMap实施，但我认为它也使用开放寻址。

所以忘记JDK类..因为你想计算经验值，你应该编写你自己的哈希表版本，它使用带有线性探测的开放寻址实现，但是当你尝试从其中获取值时，你应该注意计算探测长度哈希图..

例如，您可以编写哈希图，然后处理

class YourHashMap
{
   int empiricalGet(K key)
   {
     // search for the key but store the probe length of this get operation

     return probeLength;
   }
}

然后，您可以通过搜索所需的键数并计算平均探针长度来轻松对其进行基准测试。

否则，您可以只提供 hasmap 存储总探测长度和请求的计数的能力，并在基准运行后检索它们以计算平均值。

这种练习必须证明经验值与理论值一致。因此，还要考虑到您可能需要许多基准，然后对所有基准进行平均，以确保方差不会太高。

java - 如何计算成功和失败的平均探测长度 - 线性探测（哈希表）

1 回答 1

Related

Reference