使用oracle occi和c ++将1300万行转储到一个文件中

Question

我试图将数据从数据库中的表导出到csv格式的文件。 我想出了以下程序。 我的表包含大约13 million行，这个程序非常慢。

我怎样才能加速这个程序？

#include <iostream>
#include <occi.h>
#include <stdlib.h>
#include <fstream>
using namespace std;

int main()
{

    oracle::occi::Environment* environment;
    oracle::occi::Connection *con;
    oracle::occi::Statement* stmt;
    oracle::occi::ResultSet* res;

    try
    {

        ofstream outfile;
        outfile.open("example.txt");
        string user ; cin>>user;
        string pass ; cin>>pass;
        string instance ; cin >>instance;
        environment = oracle::occi::Environment::createEnvironment(oracle::occi::Environment::DEFAULT);
        con = environment->createConnection(user,pass,instance);
        string query = "SELECT A,B FROM TABLE_X";

        stmt = con->createStatement(query);
        res = stmt->executeQuery();

        while (res->next())
        {
                outfile<<res->getInt(1)<<','<<res->getInt(2)<<'\n';
        }

        outfile.close();
        stmt->closeResultSet(res);
        con->terminateStatement(stmt);
        environment->terminateConnection(con);

    }catch(oracle::occi::SQLException &e){
        std::cout<<e.what();
    }

 return 0;
}

Answer 1

使用数组提取来减少数据库往返。 以下是这里的内容。 我将尝试使用值20,50,100,1000来查找下面示例中“NumROws”的最佳值。

示例11-1如何对ResultSet使用Array Fetch

ResultSet *resultSet = stmt->executeQuery(...);
resultSet->setDataBuffer(...);
while (resultSet->next(numRows) == DATA_AVAILABLE)
   process(resultSet->getNumArrayRows() );

这会导致每列最多获取numRows数据量。 使用setDataBuffer（）接口指定的缓冲区应足够大，至少可容纳数量的numRows。

另一种策略是按范围分割任务，并使它们并行运行。 如果导出数据必须在单个文件中，则可以单独合并它们（cat file1 file2> file）。

你写的文件系统怎么样？ 它慢吗？ 你有没有尝试过写一个不同的地方？ 在正在写入输出的文件系统中。

Answer 2

我不知道你叫什么慢。 但是，与数据库读取无关，您可以通过使用write()而不是operator<<来显着提高文件i / o的写入性能。

像你这样的100万随机csv对的基准测试显示我的可怜的win8 pc的性能如下：

operator<<  outputs at a rate of 7 Mb/s
write()     outputs at a rate of 40 Mb/s

这速度提高了5倍以上，即1300万条目的约30秒。

然而，看起来很宽松的代码，你可以看看它是否值得付出努力：

    os << x << ',' << y << '\n';

变

    p=itoa(x, buff, 10); 
    while(*p)
        p++; 
    *p++ = ',';
    itoa(y, p, 10); 
    while(*p)
        p++;
    *p++ = '\n'; 
    *p++ = '\0';
    os.write(buff, p - buff);

其中buff是在循环外部分配的缓冲区。

使用oracle occi和c ++将1300万行转储到一个文件中

问题描述

2 个解决方案

解决方案1
3 2015-05-30 18:46:43

解决方案2
0 2015-05-30 19:05:10

使用oracle occi和c ++将1300万行转储到一个文件中

问题描述

2 个解决方案

解决方案1 3 2015-05-30 18:46:43

解决方案2 0 2015-05-30 19:05:10

解决方案1
3 2015-05-30 18:46:43

解决方案2
0 2015-05-30 19:05:10