Luna's blog 月亮月亮酱

CCF 201709-3 JSON查询 思路分析

2018-08-24

  

问题描述

  JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式,可以用来描述半结构化的数据。JSON 格式中的基本单元是值 (value),出于简化的目的本题只涉及 2 种类型的值:
  字符串 (string):字符串是由双引号 “ 括起来的一组字符(可以为空)。如果字符串的内容中出现双引号 “,在双引号前面加反斜杠,也就是用 " 表示;如果出现反斜杠 \,则用两个反斜杠 \ 表示。反斜杠后面不能出现 “ 和 \ 以外的字符。例如:”“、”hello”、”"\“。
  对象 (object):对象是一组键值对的无序集合(可以为空)。键值对表示对象的属性,键是属性名,值是属性的内容。对象以左花括号 { 开始,右花括号 } 结束,键值对之间以逗号 , 分隔。一个键值对的键和值之间以冒号 : 分隔。键必须是字符串,同一个对象所有键值对的键必须两两都不相同;值可以是字符串,也可以是另一个对象。例如:{}、{“foo”: “bar”}、{“Mon”: “weekday”, “Tue”: “weekday”, “Sun”: “weekend”}。
  除了字符串内部的位置,其他位置都可以插入一个或多个空格使得 JSON 的呈现更加美观,也可以在一些地方换行,不会影响所表示的数据内容。例如,上面举例的最后一个 JSON 数据也可以写成如下形式。
  {
  ”Mon”: “weekday”,
  ”Tue”: “weekday”,
  ”Sun”: “weekend”
  }
  给出一个 JSON 格式描述的数据,以及若干查询,编程返回这些查询的结果。

输入格式

  第一行是两个正整数 n 和 m,分别表示 JSON 数据的行数和查询的个数。
  接下来 n 行,描述一个 JSON 数据,保证输入是一个合法的 JSON 对象。
  接下来 m 行,每行描述一个查询。给出要查询的属性名,要求返回对应属性的内容。需要支持多层查询,各层的属性名之间用小数点 . 连接。保证查询的格式都是合法的。

输出格式

  对于输入的每一个查询,按顺序输出查询结果,每个结果占一行。
  如果查询结果是一个字符串,则输出 STRING ,其中 是字符串的值,中间用一个空格分隔。   如果查询结果是一个对象,则输出 OBJECT,不需要输出对象的内容。   如果查询结果不存在,则输出 NOTEXIST。

样例输入

10 5
{
"firstName": "John",
"lastName": "Smith",
"address": {
"streetAddress": "2ndStreet",
"city": "NewYork",
"state": "NY"
},
"esc\\aped": "\"hello\""
}
firstName
address
address.city
address.postal
esc\aped

样例输出

STRING John
OBJECT
STRING NewYork
NOTEXIST
STRING "hello"

评测用例规模与约定

  n ≤ 100,每行不超过 80 个字符。
  m ≤ 100,每个查询的长度不超过 80 个字符。
  字符串中的字符均为 ASCII 码 33-126 的可打印字符,不会出现空格。所有字符串都不是空串。
  所有作为键的字符串不会包含小数点 .。查询时键的大小写敏感。
  50%的评测用例输入的对象只有 1 层结构,80%的评测用例输入的对象结构层数不超过 2 层。举例来说,{“a”: “b”} 是一层结构的对象,{“a”: {“b”: “c”}} 是二层结构的对象,以此类推。

思路分析

  一开始拿到这题拿到这个题也是没想到什么好的思路,死磕题目所给的格式条件,加各种if、flag判断,写了很久也没没有写出很好的方法,其实这题在第三题中还是相对简单的,测试用例比较宽松,一开始只针对题目所给的例子写了代码也通过了40%。

  其实输入的字符串中很多是在最后的结果中要去掉的,比如",\,space

  直接在一开始就去除掉这些影响后续判断的字符后将再整个输入行拼接成一个字符串,这样问题就简化多了。

 {firstName:John,lastName:Smith,address:{streetAddress:2ndStreet,city:NewYork,state:NY},esc\aped:"hello"} 

  如果是普通的一对一字符串直接将其储存在map里就行了,如果是一对多呢,再构建一个map吗,其实不必,可以直接将父对象名.子对象名直接作为map的key值,这样问题就迎刃而解了。

  通过以上的分析,可以构建一个栈用来存当前遍历到的string,一个对象名string数组用来存多层的对象名string,如果当前字符串后面是:,则当前字符串入栈,如果是,则出栈并添加到map中。如果是{,判断栈中是否有元素,如果有则将最后一个元素pushback到对象名数组中,如果是},对象名数组popback。

代码如下:

#include <iostream>
#include <string>
#include <algorithm>
#include <vector>
#include <map>
#include <stack>
using namespace std;
int main()
{
	int m,n;
	cin>>m>>n;
	cin.get();
	map<string,string> tab;
	vector<string> objname;
	string strtemp;
	string str;
	while (m-->0)
	{
		string temp;
		getline(cin,temp);
		strtemp+=temp;
	}
	for (int i=0;i<strtemp.size();i++)
	{
		if (strtemp[i]==' '||strtemp[i]=='\"')
		{
			continue;
		}
		else if(strtemp[i]=='\\')
		{
			i++;
		}
		str+=strtemp[i];
	}
	stack<string> sta;
	int per=-1;
	for (int i=0;i<str.size();i++)
	{
		switch (str[i])
		{
		case '{':
			if (!sta.empty())
			{
				string key;
				for (int j=0;j<objname.size();j++)
				{
					key+=objname[j]+'.';
				}
				key+=sta.top();
				tab[key]="OBJECT";
				objname.push_back(sta.top());
				sta.pop();
			}
			per=i+1;
			break;
		case '}':
		case ',':
			if (!sta.empty())
			{
				string key;
				for (int j=0;j<objname.size();j++)
				{
					key+=objname[j]+'.';
				}
				key+=sta.top();
				tab[key]="STRING "+string(str.begin()+per,str.begin()+i);
				sta.pop();
				per=i+1;
			}
			if (str[i]=='}' && !objname.empty())
			{
				objname.pop_back();
			}
			per=i+1;
			break;
		case ':':
			sta.push(string(str.begin()+per,str.begin()+i));
			per=i+1;
			break;
		default:
			
			break;
		}
	}
	while(n-->0)
	{
		string temp;
		cin>>temp;
		cout << (tab.find(temp)==tab.end() ? "NOTEXIST" : tab[temp]) << endl;
	}
	return 0;
}

Content