[英]Performance degradation on reading .txt files in Swift
我有一个充满数字的文本文件,并按如下方式读取文件内容
func arrayFromContentsOfFileWithName(fileName: String) -> [String]? {
guard let path = NSBundle.mainBundle().pathForResource(fileName, ofType: "txt") else {
return nil
}
do {
let content = try String(contentsOfFile:path, encoding: NSUTF8StringEncoding)
return content.componentsSeparatedByString("\n")
} catch _ as NSError {
return nil
}}
但是,当我检查性能时,content.componentsSeparatedByString(“ \\ n”)似乎存在瓶颈,如下所示:
有人可以提出解决此问题的方法吗? 或者可以一次将整个文本文件读为双倍,并且将值分开,如下所示:
let B1: [Float] = [0.0584000014, 0.0905999988, 0.0916000009, 0.0640999973, 0.0824000016, 0.0960000008, 0.0776999965, 0.0936999992, 0.0908999965, 0.0568999983, 0.0654999986, 0.0535999984, 0.0901999995, 0.0724999979, 0.104900002, 0.0798000023, 0.0962999985, 0.0914999992, 0.0680999979, 0.110100001, 0.0648000017, 0.103299998, 0.077200003, 0.0821999982, 0.0778999999, 0.074000001, 0.0710999966, 0.108499996, 0.060899999, 0.0697000027, 0.0841000006, 0.061900001]
那是因为创建新的String
很慢。 我没有研究Swift的源代码来理解为什么,但这似乎是Swift从ObjC继承下来的特征。 最重要的是,您必须将String
转换为Float
,这也不是一种快速的操作。
改用NSScanner
:
func timeBlock(label: String, block: () -> Void) {
let start = NSDate().timeIntervalSince1970
block()
let end = NSDate().timeIntervalSince1970
print("\(label): \(end - start) seconds")
}
func f1 (fileContent: String) -> [Float] {
return fileContent.componentsSeparatedByString("\n")
.flatMap { Float($0) }
}
func f2 (fileContent: String) -> [Float] {
let scanner = NSScanner(string: fileContent)
var result = [Float]()
while !scanner.atEnd {
var x: Float = 0
scanner.scanFloat(&x)
result.append(x)
}
return result
}
do {
let content = try String(contentsOfFile: path, encoding: NSUTF8StringEncoding)
timeBlock("f1") { f1(content) }
timeBlock("f2") { f2(content) }
} catch let error as NSError {
print(error.localizedDescription)
}
我创建了一个随机文件,其中包含100万行数字作为输入。 NSScanner
大约是5.3倍速度快:
f1: 4.2731032371521 seconds
f2: 0.82185697555542 seconds
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.