※ 引述《forthcoming5 (XDDD)》之铭言:
: 最近自学到ifstream等写法
: 其中有个题目是将ifstream读出来的档案
: 做分类+统整,档案是.txt
: txt的内容例如:
: &@[email protected]&&@@:((;(&
: sh tree f m hi tm it e iuytre
: Rule fixed
: 100 21
: 200 38
: 300 37
: 400 35
: 500 11
: 如果在rule跟fixed前面的文字、资料不想要
: 直接取下面的Rule跟fixed及后面的数值做处理
: 应该要怎么做呢?
: 老师是有提示用vector搭配parser等作法
: 但想很久一直没办法
: 跪求解答,将送上300p币,感恩
你可以想像 i(f)stream 是由一连串的字符所组成, 要在里面找寻特定字串可
以用 <algorithm> 里的 std::search() 来完成, 只是它要求参数必须满足
ForwardIteartor 概念 (concept), 亦即它预期迭代器 (iterator) 在没有做
累加时, 多次读出来的字符必须相同; 但 istream 物件的特性却是: 没有做快
取的情况下, 每个字符只能读一次, 是 InputRange 的概念. 当我们配对到字
串的同时, 我们也丢掉它了. 即使如此, 我们还是可以仿照 std::search() 的
逻辑顺势实作接受 InputIterator 的函式 drop_until().
drop_until() 的架构是这样的: 本体里包含一个循环, 每次迭代都只对参数做
一次累加还有读值, 并且复制读出来的物件往后做参考:
template <typename InputIterator, typename InputSentinel>
void drop_until(InputIterator first, InputSentinel last) {
while (first != last) {
auto element = *first++;
// do things here
}
}
接着我们再加入额外的参数 pattern 作为要查找的对象, 它是一种 ForwardR-
ange, 到这里和 std::search() 还蛮像的 (为了能在配对失败时重来, 我们再
新增一个迭代器物件):
template <
typename InputIterator, typename InputSentinel,
typename ForwardRange
>
void drop_until(InputIterator first, InputSentinel last,
const ForwardRange& pattern) {
// match from beginning
auto next_to_match = pattern.begin();
while (first != last && next_to_match != pattern.end()) {
auto element = *first++;
// match succeeding element in next iteration
if (element == *next_to_match) {
++next_to_match;
// fail to match, start over from second element
} else if (element == *pattern.begin()) {
next_to_match = std::next(pattern.begin());
// fail to match, start over from first element
} else {
next_to_match = pattern.begin();
}
}
}
以上还只是简单的实作, 虽然没办法处理复杂的字串, 但用来解原 po 的问题
已经足够. 有了 drop_until() 函式, 读档程式码就可以这样写:
std::ifstream file("input.txt");
drop_until(
std::istreambuf_iterator<char>(file),
std::istreambuf_iterator<char>(),
"Rule fixed\n"sv
);
unsigned rule, fixed;
while (file >> rule >> fixed) {
// do things here
}
完整范例: https://wandbox.org/permlink/gAssdOddYQtopotV
不过如果你有办法把整个档案都读进来变成一个大字串, 搭配 std::search()
的话会省下不少功夫 :)